2 Sigma 问题：一对一导师

教育领域的“应许之地”一直是一对一辅导，这一理念可以追溯到亚里士多德亲自教导年轻的亚历山大大帝。历史上唯一有可能实现这一目标的技术终于出现了。风险投资人反复鼓吹这一乌托邦式应用，却把资金投向了几乎所有其他方向。而直到今天，仍然没有人真正将它的潜力发挥到极致。

1984年，本杰明·布卢姆发现，接受一对一辅导的学生，其表现比传统课堂教学的学生高出两个标准差。也就是说，一个处于中位数（第50百分位）的辅导学生，其表现可以超过98%的普通学生。

尽管该研究设计存在一定问题，但现代更严谨的研究仍然显示，辅导的效果在0.35到0.50个标准差之间。这依然意味着，即便是一个普通导师，也能让你从第50百分位提升到第67百分位！如果拥有世界级导师，提升幅度还会更大。

这是迄今为止最有效的教育干预手段，同时也是最难规模化的方式。

在过去十多年里，一些团队构建了基于规则的（前大模型时代）系统，这些系统会根据学生之前的回答，将他们引导到不同的问题路径上，本质上类似一个复杂的流程图。

这些系统还尝试应用其他经过验证的学习方法，例如间隔重复、掌握式学习以及即时反馈。

它们看起来确实有一定效果。例如 ASSISTments 在2800名学生的随机对照试验中取得了0.18到0.29个标准差的效果。DARPA 花费1亿美元、历时七年开发了一套数字导师系统，用于培训海军IT人员，据称效果达到1到3个标准差。Synthesis 和 Math Academy 认为他们可以在K-12数学领域实现多个标准差的提升，尽管也有人持不同意见。

产品仍停留在20年前

无论这些系统在现实中的效果如何，我们认为它们很难获得广泛采用，因为学习体验的丰富性仍然局限于动态题目分配算法。

用户体验是静态的、缺乏生命力的、机械化的：屏幕上的文字，也许配上一张静态图片，底部是一个等待点击的选择题框。

绝大多数人并不喜欢这样的学习方式，即使勉强坚持，也无法达到最佳学习效果。

教学引擎或许在底层做了复杂的优化，内容质量或许很高，但学生真正接触到的界面，与一本会自动评分的教科书几乎没有区别。

它们与真正的顶级线下一对一导师之间的差距，就像舔电脑屏幕上的冰淇淋图片。

那个没人愿意谈论的“房间里的大象”

现代生成式人工智能，是历史上唯一可能真正实现这种理想的一对一教学体验的技术，而且成本几乎可以忽略不计。它甚至有可能同时解决产品体验和经济模型的问题。

然而，没有人真正朝这个方向构建产品。事实上，我们接触的几乎所有教育科技公司都明确否认其价值，认为它或许可以一次性生成80%质量的课程，但剩下的20%缺陷使其毫无用处。即使我们提醒他们几年后情况可能不同，他们依然坚持“我的职业会是最后一个被替代的”这种说法。

指数级变化，即便对数学老师来说也很难真正理解。

我们的核心观点是：参与感与深度学习不再必须相互对立。

当教学真正有效时，学习可以成为一种极具成就感、提升自信、甚至令人愉悦的体验。令人痛苦的是那种漫无目的的摸索，以及缺乏基础知识导致连入门都困难的状态。世界上最优秀的老师，能够迅速缩短努力与“顿悟时刻”之间的距离，同时让你感到被理解和被赋能。

一个超人级教师，很快就可以被构建出来。研究表明，经过适当结构设计的大语言模型，已经可以成为相当不错的一对一导师。目前的准确性与幻觉问题，在良好设计下可以控制在约1%。上下文长度仍是工程挑战，因为随着对话持续，质量与连贯性会下降，类似 Claude Code 会话中的压缩问题。但在两年内，它们几乎肯定可以实时生成世界级课程。

此外，大语言模型已经展现出生成丰富、个性化、多模态内容的能力。过去一年，它们可以基于你的内容生成定制播客。现在，它们已经能够一次性生成动态数学可视化视频。

很快，这些多模态体验将变得可交互。你可以通过语音打断、提问，并获得深入回答。教学将从单向讲授转变为对话。产品将从被动消费转变为层层递进的主动体验式学习。

这些能力还会继续增强，例如构建“世界模型”。历史课程可以让你身临其境地置身历史场景，与历史人物对话。游戏可以达到GTA级别，同时让你学习核心知识。

甚至可以用虚拟化身作为导师。类似 Masterclass 的商业模式可以被重塑，名人无需花费时间录制课程，只需授权其形象。

另一种提升参与度的方式是个性化。例如，一个孩子热爱棒球，那么他的课程就由他喜欢的球星讲解，所有题目都围绕棒球展开。系统还应识别你是视觉型学习者，并调整教学方式。

学习如何学习

系统应能够自主学习教学方法，即理解“人类如何学习”，以及“某个个体如何学习”。它应能在低数据环境中进行实验，并调整自身行为。

理论上，它可以利用用户所有交互数据：答题记录、反应时间、语音语调中的自信程度、摄像头捕捉的面部表情、视线焦点等。

当然，这需要用户信任设备端AI或隐私保护技术，例如 zkML。

更具技术野心的方案，是构建一个多模态Transformer，将这些输入转化为实时认知状态分布。例如区分“机械执行步骤”与“有效探索性思考”。

一种可能的路径是：使用前沿模型生成大量“学生代理”，在模拟环境中训练教学系统，再通过少量真实学生验证。

布卢姆愿景的科幻实现

这些学习引擎可以应用在哪些场景？我们对其在STEM辅导、SAT备考和职业发展中的应用感到兴奋。

但还有许多被忽视的可能性：

一个帮助你提升工作能力的浏览器插件：它观察你的工作流程，推荐学习内容或自动化重复任务。

一个“以自信为核心”的技能平台：类似语言学习应用，通过虚拟现实练习演讲或面试，消除心理压力。

脑机接口用于提升学习效率：例如刺激语言学习相关脑区，或通过脑电信号捕捉“顿悟时刻”，自动生成学习笔记。

全新的商业模式

例如垂直整合的技能培训公司，快速培养电工、暖通技师等高需求职业。

或者一个以“理想工作”为目标的学习系统，仅教授必要知识，大幅缩短培养周期。

甚至可以构建逼真的职业模拟环境，用于评估人才并直接输送给企业。

这些想法真的能获得风险投资吗？

教育科技市场规模巨大：美国K-12支出9500亿美元，高等教育7000亿美元，辅导市场250亿美元。

但创业公司只占据了极小一部分。原因在于，教育本质上是人与人之间的服务，门槛是“人类级认知与交互”。

商业模式问题

真正的学习是痛苦的，而卖“痛苦”本身就很难。

因此成功的教育产品要么提供捷径（如Chegg、ChatGPT），要么用游戏化替代深度学习（如Duolingo）。

但这往往破坏学习本质。

同时，教育类产品的用户流失率极高，用户又希望在7到14天内看到回报，这与学习周期完全不匹配。

内容成本

制作课程成本极高：MOOC 单门课程成本在4万到30万美元之间。

再加上运营和营销成本，使得多数教育公司难以盈利。

经济模型的变化

未来，如果推理成本降低、模型本地化运行，教育科技的经济性可能大幅改善。

同时，动态生成课程将取代高昂的内容制作成本。

快速学习可能成为生存问题

随着AGI的到来，大量工作将被改变甚至消失，快速学习新技能可能成为生存所需。

传统教育体系难以适应这种变化。

结语

我们可以想象这样一个未来：每个人都拥有一个无限耐心、极具吸引力、完全个性化的世界级导师。他们以自己的节奏高效学习。

而人类教师则专注于真正属于人类的部分：激励、关系与情感。

Subscribe 订阅