最近,一种基于大型语言模型(LLMs)的技术显示,人工智能(AI)可以帮助数学家产生新的解决方案。这项技术被应用于“Set”这款纸牌游戏所启发的数学问题,取得了显著成果。
这个名为FunSearch的AI系统,在组合数学领域的Set启发问题上取得了进展。组合数学是研究如何计算有限物体集合可能排列的数学领域。但其发明者表示,这种方法不仅适用于数学和计算机科学中的多种问题,还在12月14日的《自然》杂志上进行了描述。
谷歌DeepMind的AI for Science团队负责人、计算机科学家Pushmeet Kohli说:“这是首次有人展示基于LLM的系统可以超越数学家和计算机科学家已知的内容。这不仅是新颖的,而且比现存的任何方法都更有效。”
与此相反,之前的实验中,研究人员使用大型语言模型解决已知解决方案的数学问题。
FunSearch通过自动创建请求来使用特别训练的LLM,要求它编写能生成特定数学问题解决方案的短程序。然后,系统会快速检查这些解决方案是否优于已知的。如果不是,它会向LLM提供反馈,以便下一轮改进。
DeepMind的计算机科学家Bernardino Romera-Paredes表示:“我们使用LLM的方式就像是一个创造力引擎。” LLM生成的程序并非都有用,有些甚至错误到无法运行。但另一个程序可以迅速丢弃错误的程序并测试正确程序的输出。
该团队在“cap set problem”上测试了FunSearch。这个问题起源于1970年代遗传学家Marsha Falco发明的游戏Set。Set牌组包含81张卡片,每张卡片展示了一、二或三个相同颜色、形状和阴影的符号——对于这些特征,每个都有三个可能的选项。这些可能性加在一起等于3 × 3 × 3 × 3 = 81。玩家需要翻开卡片,找出三张卡片的特殊组合,称为sets。
数学家已经证明,如果翻开的卡片至少有21张,玩家就保证能找到一个set。他们还为游戏的更复杂版本找到了解决方案,在这些版本中,卡片的抽象版本具有五个或更多的属性。但仍有一些谜团未解。例如,如果有n个属性,其中n是任何整数,那么就有3n种可能的卡片——但保证找到解决方案所需的最小卡片数尚不明确。
这个问题可以用离散几何的方式来表达。在那里,它相当于在n维空间中找到三个点的特定排列。数学家已经能够对可能的通用解决方案设定界限——给定n,他们发现桌上必须有的“卡片”数量必须大于某个公式给出的数,但小于另一个公式给出的数。
FunSearch在n = 8的下界上取得了进展,生成了满足游戏所有要求的卡片集合。DeepMind的计算机科学家Alhussein Fawzi说:“我们没有证明我们无法在此基础上取得进展,但我们确实得到了一个超越以前已知内容的构造。”
FunSearch的一个重要特点是,人们可以看到LLM创建的成功程序,并从中学习,这与其他应用不同,在其他应用中,AI是一个黑箱。
共同作者、威斯康星大学麦迪逊分校的数学家Jordan Ellenberg说:“对我来说最激动人心的是,模拟新的人机合作模式。我不是想用这些作为人类数学家的替代品,而是作为一种力量的放大器。”