坐下来与一位人工智能(AI)模型进行一场两个小时的访谈:一把友善的声音带领你回顾童年、人生关键记忆、职业经历,甚至你的移民政策观念。不久之后,一个虚拟的“你”将以惊人的准确度呈现你的价值观和偏好。听起来像科幻?如今,这已成为现实。
斯坦福与 DeepMind 的研究突破:AI 模拟个体
近日,一支由斯坦福大学与 Google DeepMind 的研究团队发表了一篇论文(尚未经过同行评审),展示了这一技术的可能性。这项研究由斯坦福计算机科学博士生 Joon Sung Park 领导,团队邀请了1000名参与者,涵盖不同年龄、性别、种族、地区、教育背景和政治理念。参与者接受了两小时访谈,并获得最高100美元的报酬。研究团队利用这些访谈数据,创建了每位参与者的“模拟代理”(simulation agents)。这些虚拟代理随后与人类主体完成了一系列性格测试、社交调查和逻辑游戏,结果显示,虚拟代理的表现与人类主体之间有85%的相似度。
Park 表示:“如果有一群‘迷你版的你’能在世界中活动,并做出和你一致的决策,那可能就是未来的图景。”
模拟代理的潜力:社会科学与技术创新的结合
论文中的“模拟代理”被设想为社会科学研究的一种革命性工具。传统研究中,涉及大规模人群的实验往往耗资巨大或难以实施,而模拟代理为研究复杂社会现象(如社交媒体如何抑制错误信息传播或造成交通拥堵的行为模式)提供了一种经济且高效的替代方案。
这类代理与当前热门的“工具型代理”(tool-based agents)有所不同。后者专注于完成具体任务,例如录入数据、检索信息,甚至预订行程并安排会议。Salesforce、Anthropic 和 OpenAI 等公司近年来都在这一领域投入巨大。然而,Park 团队的研究表明,模拟代理的成果或将推动更强大的 AI 代理技术的发展。
研究启示与隐忧:从机遇到挑战
MIT Sloan 管理学院信息技术副教授 John Horton 对此评价道:“这篇论文展示了如何结合人类生成的个性化数据与 AI 模型的程序化模拟能力,创造全新的研究可能性。”
然而,这项技术也带来了深远的伦理问题。与生成图像技术带来的“深度伪造”类似,代理生成技术可能被用于未经授权地模拟某人,甚至“代表”他们发表不实声明。此外,研究中用于评估 AI 模拟效果的方法也较为基础,例如通过常见的社会调查(General Social Survey)和五大性格特质(Big Five Personality Traits)测试评估代理与主体的相似性。尽管这些方法能衡量宏观趋势,但它们无法完全捕捉人类的复杂与独特性。
研究还发现,在一些行为测试中,AI 模拟代理的表现显著逊色。例如,在“独裁者游戏”(dictator game)中,AI 的决策无法准确反映人类对公平等价值的考量。
高效“数字分身”:访谈的重要性
为了让 AI 更好地模拟个体,研究团队选择了访谈的形式作为数据采集方式。Park 表示,与传统问卷相比,访谈能高效捕捉个体独特的经历与细节。例如,一位刚刚战胜癌症的受访者会因此展现出独特的行为模式,这类信息很难通过常规问卷获取。
Park 的这一观点源自他自己的经验。他在2023年的一篇论文引发关注后,曾接受多次播客访谈。他发现,每次长达两小时的访谈后,听众对他的了解显著加深。“两小时的访谈非常有力量,”他说,“它能揭示很多微妙而重要的东西。”
相比之下,一些公司则尝试通过客户的邮件或数据来构建“数字分身”。例如,AI 公司 Tavus 的 CEO Hassaan Raza 表示,该方法需要大量数据来复制用户的性格,但 Park 的研究显示,访谈可能是更高效的替代方案。Raza 计划尝试这一思路:“与 AI 访谈30分钟或一小时,就能生成你的数字分身,这听起来相当酷。”
未来的图景:从社会研究到日常生活
尽管模拟代理技术仍处于早期阶段,其潜力无疑巨大。从社会科学研究到个性化工具,再到日常决策的自动化,AI 模拟代理或将重新定义人与技术的关系。当然,为了确保其发展方向符合伦理与社会价值,我们需要更多关于技术监管和隐私保护的讨论。
Park 的愿景是:“一群迷你版的‘你’”,不仅能理解你的思维模式,还能为你在复杂世界中提供新的解决方案。而这,也许正是 AI 的下一个边界。