教育领域的“应许之地”一直是一对一辅导,这一理念可以追溯到亚里士多德亲自教导年轻的亚历山大大帝。历史上唯一有可能实现这一目标的技术终于出现了。风险投资人反复鼓吹这一乌托邦式应用,却把资金投向了几乎所有其他方向。而直到今天,仍然没有人真正将它的潜力发挥到极致。
1984年,本杰明·布卢姆发现,接受一对一辅导的学生,其表现比传统课堂教学的学生高出两个标准差。也就是说,一个处于中位数(第50百分位)的辅导学生,其表现可以超过98%的普通学生。
尽管该研究设计存在一定问题,但现代更严谨的研究仍然显示,辅导的效果在0.35到0.50个标准差之间。这依然意味着,即便是一个普通导师,也能让你从第50百分位提升到第67百分位!如果拥有世界级导师,提升幅度还会更大。
这是迄今为止最有效的教育干预手段,同时也是最难规模化的方式。
在过去十多年里,一些团队构建了基于规则的(前大模型时代)系统,这些系统会根据学生之前的回答,将他们引导到不同的问题路径上,本质上类似一个复杂的流程图。
这些系统还尝试应用其他经过验证的学习方法,例如间隔重复、掌握式学习以及即时反馈。
它们看起来确实有一定效果。例如 ASSISTments 在2800名学生的随机对照试验中取得了0.18到0.29个标准差的效果。DARPA 花费1亿美元、历时七年开发了一套数字导师系统,用于培训海军IT人员,据称效果达到1到3个标准差。Synthesis 和 Math Academy 认为他们可以在K-12数学领域实现多个标准差的提升,尽管也有人持不同意见。
产品仍停留在20年前
无论这些系统在现实中的效果如何,我们认为它们很难获得广泛采用,因为学习体验的丰富性仍然局限于动态题目分配算法。
用户体验是静态的、缺乏生命力的、机械化的:屏幕上的文字,也许配上一张静态图片,底部是一个等待点击的选择题框。
绝大多数人并不喜欢这样的学习方式,即使勉强坚持,也无法达到最佳学习效果。
教学引擎或许在底层做了复杂的优化,内容质量或许很高,但学生真正接触到的界面,与一本会自动评分的教科书几乎没有区别。
它们与真正的顶级线下一对一导师之间的差距,就像舔电脑屏幕上的冰淇淋图片。
那个没人愿意谈论的“房间里的大象”
现代生成式人工智能,是历史上唯一可能真正实现这种理想的一对一教学体验的技术,而且成本几乎可以忽略不计。它甚至有可能同时解决产品体验和经济模型的问题。
然而,没有人真正朝这个方向构建产品。事实上,我们接触的几乎所有教育科技公司都明确否认其价值,认为它或许可以一次性生成80%质量的课程,但剩下的20%缺陷使其毫无用处。即使我们提醒他们几年后情况可能不同,他们依然坚持“我的职业会是最后一个被替代的”这种说法。
指数级变化,即便对数学老师来说也很难真正理解。
我们的核心观点是:参与感与深度学习不再必须相互对立。
当教学真正有效时,学习可以成为一种极具成就感、提升自信、甚至令人愉悦的体验。令人痛苦的是那种漫无目的的摸索,以及缺乏基础知识导致连入门都困难的状态。世界上最优秀的老师,能够迅速缩短努力与“顿悟时刻”之间的距离,同时让你感到被理解和被赋能。
一个超人级教师,很快就可以被构建出来。研究表明,经过适当结构设计的大语言模型,已经可以成为相当不错的一对一导师。目前的准确性与幻觉问题,在良好设计下可以控制在约1%。上下文长度仍是工程挑战,因为随着对话持续,质量与连贯性会下降,类似 Claude Code 会话中的压缩问题。但在两年内,它们几乎肯定可以实时生成世界级课程。
此外,大语言模型已经展现出生成丰富、个性化、多模态内容的能力。过去一年,它们可以基于你的内容生成定制播客。现在,它们已经能够一次性生成动态数学可视化视频。
很快,这些多模态体验将变得可交互。你可以通过语音打断、提问,并获得深入回答。教学将从单向讲授转变为对话。产品将从被动消费转变为层层递进的主动体验式学习。
这些能力还会继续增强,例如构建“世界模型”。历史课程可以让你身临其境地置身历史场景,与历史人物对话。游戏可以达到GTA级别,同时让你学习核心知识。
甚至可以用虚拟化身作为导师。类似 Masterclass 的商业模式可以被重塑,名人无需花费时间录制课程,只需授权其形象。
另一种提升参与度的方式是个性化。例如,一个孩子热爱棒球,那么他的课程就由他喜欢的球星讲解,所有题目都围绕棒球展开。系统还应识别你是视觉型学习者,并调整教学方式。
学习如何学习
系统应能够自主学习教学方法,即理解“人类如何学习”,以及“某个个体如何学习”。它应能在低数据环境中进行实验,并调整自身行为。
理论上,它可以利用用户所有交互数据:答题记录、反应时间、语音语调中的自信程度、摄像头捕捉的面部表情、视线焦点等。
当然,这需要用户信任设备端AI或隐私保护技术,例如 zkML。
更具技术野心的方案,是构建一个多模态Transformer,将这些输入转化为实时认知状态分布。例如区分“机械执行步骤”与“有效探索性思考”。
一种可能的路径是:使用前沿模型生成大量“学生代理”,在模拟环境中训练教学系统,再通过少量真实学生验证。
布卢姆愿景的科幻实现
这些学习引擎可以应用在哪些场景?我们对其在STEM辅导、SAT备考和职业发展中的应用感到兴奋。
但还有许多被忽视的可能性:
一个帮助你提升工作能力的浏览器插件:它观察你的工作流程,推荐学习内容或自动化重复任务。
一个“以自信为核心”的技能平台:类似语言学习应用,通过虚拟现实练习演讲或面试,消除心理压力。
脑机接口用于提升学习效率:例如刺激语言学习相关脑区,或通过脑电信号捕捉“顿悟时刻”,自动生成学习笔记。
全新的商业模式
例如垂直整合的技能培训公司,快速培养电工、暖通技师等高需求职业。
或者一个以“理想工作”为目标的学习系统,仅教授必要知识,大幅缩短培养周期。
甚至可以构建逼真的职业模拟环境,用于评估人才并直接输送给企业。
这些想法真的能获得风险投资吗?
教育科技市场规模巨大:美国K-12支出9500亿美元,高等教育7000亿美元,辅导市场250亿美元。
但创业公司只占据了极小一部分。原因在于,教育本质上是人与人之间的服务,门槛是“人类级认知与交互”。
商业模式问题
真正的学习是痛苦的,而卖“痛苦”本身就很难。
因此成功的教育产品要么提供捷径(如Chegg、ChatGPT),要么用游戏化替代深度学习(如Duolingo)。
但这往往破坏学习本质。
同时,教育类产品的用户流失率极高,用户又希望在7到14天内看到回报,这与学习周期完全不匹配。
内容成本
制作课程成本极高:MOOC 单门课程成本在4万到30万美元之间。
再加上运营和营销成本,使得多数教育公司难以盈利。
经济模型的变化
未来,如果推理成本降低、模型本地化运行,教育科技的经济性可能大幅改善。
同时,动态生成课程将取代高昂的内容制作成本。
快速学习可能成为生存问题
随着AGI的到来,大量工作将被改变甚至消失,快速学习新技能可能成为生存所需。
传统教育体系难以适应这种变化。
结语
我们可以想象这样一个未来:每个人都拥有一个无限耐心、极具吸引力、完全个性化的世界级导师。他们以自己的节奏高效学习。
而人类教师则专注于真正属于人类的部分:激励、关系与情感。