在八月中旬的一个星期六早晨,Alex Naka在女友的厨房里开始了一场他自称的“小型黑客马拉松”。凭借一台笔记本电脑、几杯咖啡,以及一度借助80个基于云的人工智能处理器,他生成了大量计算设计的蛋白质,目标是阻断一种在某些肿瘤中突变的细胞受体。
Naka是一名蛋白质工程师,工作日在加州阿拉米达的一家医疗科技公司上班。在周末的这一场“马拉松”中,他将最有前途的十个蛋白质设计提交到了一个刚启动的蛋白质设计竞赛中,随后见证它们迅速攀升到排行榜的顶端。
这个竞赛由瑞士洛桑的生物科技初创公司Adaptyv Bio举办,是过去一年中涌现出的至少五个类似竞赛之一。参赛者大多使用像AlphaFold这样的人工智能工具,以及类似聊天机器人模型的“蛋白质语言模型”,这些工具近年来迅速普及并变得极具威力。部分开发这些工具的研究人员因为他们的贡献获得了今年的诺贝尔化学奖,这也反映出人们对新型蛋白质在药物、工业酶或实验试剂方面潜力的期望。
然而,尽管蛋白质设计热潮正盛,许多科学家却表示,这种爆发式增长也带来了困惑。蛋白质设计的速度远远超过了实验室的制造和测试能力,导致很难区分哪些方法真正有效。
竞赛曾经推动了蛋白质结构预测领域的重大突破,最新一批设计竞赛则通过降低准入门槛,将更多来自世界各地的人吸引到相关领域。竞赛还可能加快验证和标准化的步伐,甚至帮助建立一个新的科研社区。巴塞罗那基因组调控中心的计算生物学家Noelia Ferruz Capapey表示:“它会推动该领域更快地测试方法和进展。”
但科学家也指出,竞赛面临一些挑战,如如何选择合适的问题以及如何客观评判优胜者。慕尼黑工业大学的计算生物学家Burkhard Rost警告道:“如果这些竞赛执行得不好,可能会对整个领域造成损害。”
设计中的竞争性
蛋白质设计竞赛的灵感部分来自于已有30年历史的结构预测竞赛CASP。自1994年以来,这项竞赛挑战科学家根据氨基酸序列预测蛋白质的三维形状。2018年,DeepMind(现为Google DeepMind)凭借AlphaFold首次赢得该竞赛。到了2020年,AlphaFold 2表现优异,创始人John Moult称简单蛋白质结构的预测问题基本解决。
如今,许多人希望这些蛋白质设计竞赛能像CASP推动蛋白质结构预测领域一样,推动蛋白质设计领域的进步。Rost表示:“如果没有CASP,AlphaFold可能根本不会出现。我们需要这些竞赛来激励人们,推动正确的发展。”
今年6月,Rost和同事赢得了Align to Innovate组织的蛋白质工程竞赛,参赛者首先预测不同酶变体的特性,最成功的团队接着对一种分解淀粉的酶进行了重新设计,通过实验室测试决定最佳设计。
另外,来自加拿大Liberum Bio公司和Rosetta Commons的竞赛也让参赛者重新设计了用于蛋白质纯化的植物病毒酶,目的是提高其效率。而Bits to Binders竞赛则挑战研究人员设计小型蛋白质用于T细胞癌症治疗,共有64支队伍参加,来自42个国家。
欢迎新手参与
Adaptyv的首席执行官兼联合创始人Julian Englert表示,虽然大多数参赛者是蛋白质设计领域的专业人士,但也有许多来自非生物学背景的有力竞争者。比如,一位来自伊朗的参赛者仅凭一台游戏电脑就成功进行了设计,因为他无法获得更强大的计算系统。
Englert认为,这些高质量的业余作品让他联想到Apple和Microsoft等科技巨头的车库起源。他设想未来可能会出现“自由职业的蛋白质设计师”,为企业、学术实验室等定制分子。
超越现金奖励
虽然一些竞赛提供奖品,比如Bits to Binders的优胜者将获得3D打印的奖杯和生物科技公司的周边产品,Adaptyv的优胜者则可以获得免费实验和纪念品。但最引人注目的是最近启动的Evolved 2024竞赛,优胜团队将获得价值2.5万美元的亚马逊云服务积分,以及其他公司提供的数千美元奖励。
然而,选择优胜者并非易事。即使是那些目标明确的设计竞赛,如何评判设计仍充满挑战。Align to Innovate的创始人Erika DeBenedictis指出:“设计蛋白质有很多可能失败的地方。”
尽管如此,这些竞赛可能在推动蛋白质设计领域方面发挥重要作用,特别是在帮助建立一个融合了生物化学实验室和机器学习领域的社区。
当Adaptyv竞赛的结果在九月底公布时,Naka感到有些失望。尽管他的十个设计看似都很有前途,但在实验室中却没有一个起效。最终,147个提交的设计中,只有5个成功绑定了目标分子,甚至有超过50个设计无法制造。
然而,这样的失败并不罕见,Naka指出:“在蛋白质工程中,失败是常态。” 他表示自己将继续参加未来的类似竞赛,期待下次能取得更好的成绩。