麻省理工学院(MIT)近日推出了Boltz-1,一款强大的开源AI模型,旨在大幅加速生物医学研究与药物开发。Boltz-1由MIT Jameel健康机器学习实验室的研究团队开发,是首个在性能上达到与DeepMind的AlphaFold3相媲美的完全开源模型。https://github.com/jwohlwend/boltz
突破与背景:从AlphaFold到Boltz-1
蛋白质是生物体几乎所有生物过程的核心,其3D结构与功能密切相关。然而,由于蛋白质长链氨基酸折叠成3D结构的过程极为复杂,准确预测蛋白质结构长期以来是一项科学难题。
DeepMind的AlphaFold2利用机器学习技术,快速预测3D蛋白质结构,其准确度与实验方法无异,这一突破使得Demis Hassabis和John Jumper荣获2024年诺贝尔化学奖。AlphaFold3进一步引入了生成式AI(扩散模型),能够更好地处理蛋白质结构预测中存在的不确定性。然而,AlphaFold3并未完全开源,也不对商业用途开放,这引发了科学界的不满,并掀起了全球范围内对可商用版本模型的竞赛。
Boltz-1:开源与创新
MIT团队基于AlphaFold3的初始方法进行了深入研究,通过分析其核心的扩散模型,探索了潜在的改进方向,并纳入了能够显著提高模型准确度的算法。例如,他们引入了新的算法来提升预测效率。
Boltz-1不仅是一个开源模型,MIT团队还开放了整个训练与微调流程,方便全球科学家在此基础上进行进一步研究和改进。
MIT电气工程与计算机科学教授Regina Barzilay表示:“Jeremy、Gabriele、Saro以及整个Jameel实验室团队的努力令人骄傲。这一项目耗费了无数个日夜,付出了坚定不移的决心。未来还有很多激动人心的改进计划,我们将在未来几个月持续分享。”
开发与挑战
Boltz-1的开发历时四个月,团队通过大量实验克服了诸多挑战,其中最大的难点是处理蛋白质数据银行(Protein Data Bank)中的数据异质性与模糊性。蛋白质数据银行是全球科学家70年来解析的所有生物分子结构的集合,包含大量复杂和不一致的数据。
Boltz-1的主要开发者之一、MIT研究生Jeremy Wohlwend坦言:“处理这些数据让我度过了无数个不眠之夜。很多时候,这完全依赖于领域知识积累,没有捷径可走。”
最终实验结果显示,Boltz-1在复杂生物分子结构预测上的准确度已达到与AlphaFold3相同的水平。
Boltz-1的意义与应用前景
MIT电气工程与计算机科学教授Tommi Jaakkola表示:“Jeremy、Gabriele和Saro的成就非凡。他们的努力让生物分子结构预测变得更加开放和可及,将彻底革新分子科学领域的进展。”
Boltz-1的开源模式受到了广泛好评。Parabilis Medicines的CEO Mathai Mammen将其称为“突破性”模型:“通过开源这一成果,MIT Jameel实验室及其合作伙伴正在将最尖端的结构生物学工具普及化。这一里程碑式的努力将加速挽救生命的新药研发进程。”
MIT生物学教授Jonathan Weissman也表示:“Boltz-1将极大推动我的实验室以及整个研究社区的发展。这个工具的开源特性将催生一波新的科学发现,并激发出大量创造性的应用。”
未来计划与合作邀请
MIT团队计划持续优化Boltz-1的性能,缩短结构预测的时间。他们还邀请全球研究人员通过Boltz-1的GitHub仓库尝试这一模型,并通过Slack社区与其他用户交流合作。
研究团队成员Gabriele Corso强调:“我们将Boltz-1视为社区合作的起点,而不是终点。我们期待与全球科学家共同努力,不断推动这一工具的发展。”
结语
Boltz-1的发布标志着AI在生物分子建模领域的一次重大进步。作为一款完全开源的AI模型,它不仅推动了生物医学研究的民主化,还为全球科研团队提供了一个强大而灵活的平台,助力药物开发与生物工程的未来创新。