斯坦福与 DeepMind 的研究突破：AI 模拟个体

坐下来与一位人工智能（AI）模型进行一场两个小时的访谈：一把友善的声音带领你回顾童年、人生关键记忆、职业经历，甚至你的移民政策观念。不久之后，一个虚拟的“你”将以惊人的准确度呈现你的价值观和偏好。听起来像科幻？如今，这已成为现实。

斯坦福与 DeepMind 的研究突破：AI 模拟个体

近日，一支由斯坦福大学与 Google DeepMind 的研究团队发表了一篇论文（尚未经过同行评审），展示了这一技术的可能性。这项研究由斯坦福计算机科学博士生 Joon Sung Park 领导，团队邀请了1000名参与者，涵盖不同年龄、性别、种族、地区、教育背景和政治理念。参与者接受了两小时访谈，并获得最高100美元的报酬。研究团队利用这些访谈数据，创建了每位参与者的“模拟代理”（simulation agents）。这些虚拟代理随后与人类主体完成了一系列性格测试、社交调查和逻辑游戏，结果显示，虚拟代理的表现与人类主体之间有85%的相似度。

Park 表示：“如果有一群‘迷你版的你’能在世界中活动，并做出和你一致的决策，那可能就是未来的图景。”

模拟代理的潜力：社会科学与技术创新的结合

论文中的“模拟代理”被设想为社会科学研究的一种革命性工具。传统研究中，涉及大规模人群的实验往往耗资巨大或难以实施，而模拟代理为研究复杂社会现象（如社交媒体如何抑制错误信息传播或造成交通拥堵的行为模式）提供了一种经济且高效的替代方案。

这类代理与当前热门的“工具型代理”（tool-based agents）有所不同。后者专注于完成具体任务，例如录入数据、检索信息，甚至预订行程并安排会议。Salesforce、Anthropic 和 OpenAI 等公司近年来都在这一领域投入巨大。然而，Park 团队的研究表明，模拟代理的成果或将推动更强大的 AI 代理技术的发展。

研究启示与隐忧：从机遇到挑战

MIT Sloan 管理学院信息技术副教授 John Horton 对此评价道：“这篇论文展示了如何结合人类生成的个性化数据与 AI 模型的程序化模拟能力，创造全新的研究可能性。”

然而，这项技术也带来了深远的伦理问题。与生成图像技术带来的“深度伪造”类似，代理生成技术可能被用于未经授权地模拟某人，甚至“代表”他们发表不实声明。此外，研究中用于评估 AI 模拟效果的方法也较为基础，例如通过常见的社会调查（General Social Survey）和五大性格特质（Big Five Personality Traits）测试评估代理与主体的相似性。尽管这些方法能衡量宏观趋势，但它们无法完全捕捉人类的复杂与独特性。

研究还发现，在一些行为测试中，AI 模拟代理的表现显著逊色。例如，在“独裁者游戏”（dictator game）中，AI 的决策无法准确反映人类对公平等价值的考量。

高效“数字分身”：访谈的重要性

为了让 AI 更好地模拟个体，研究团队选择了访谈的形式作为数据采集方式。Park 表示，与传统问卷相比，访谈能高效捕捉个体独特的经历与细节。例如，一位刚刚战胜癌症的受访者会因此展现出独特的行为模式，这类信息很难通过常规问卷获取。

Park 的这一观点源自他自己的经验。他在2023年的一篇论文引发关注后，曾接受多次播客访谈。他发现，每次长达两小时的访谈后，听众对他的了解显著加深。“两小时的访谈非常有力量，”他说，“它能揭示很多微妙而重要的东西。”

相比之下，一些公司则尝试通过客户的邮件或数据来构建“数字分身”。例如，AI 公司 Tavus 的 CEO Hassaan Raza 表示，该方法需要大量数据来复制用户的性格，但 Park 的研究显示，访谈可能是更高效的替代方案。Raza 计划尝试这一思路：“与 AI 访谈30分钟或一小时，就能生成你的数字分身，这听起来相当酷。”

未来的图景：从社会研究到日常生活

尽管模拟代理技术仍处于早期阶段，其潜力无疑巨大。从社会科学研究到个性化工具，再到日常决策的自动化，AI 模拟代理或将重新定义人与技术的关系。当然，为了确保其发展方向符合伦理与社会价值，我们需要更多关于技术监管和隐私保护的讨论。

Park 的愿景是：“一群迷你版的‘你’”，不仅能理解你的思维模式，还能为你在复杂世界中提供新的解决方案。而这，也许正是 AI 的下一个边界。

Subscribe 订阅