在一项名为《用可编程生成模型照亮蛋白质空间》的新研究中,研究人员介绍了一种生成型人工智能(AI)模型,名为Chroma,它能够创造出自然界中未曾发现的具有可编程属性的新型蛋白质,并在实验室中展示了其疗效潜力。
这项研究来自马萨诸塞州索默维尔市的Generate:Biomedicines公司,该公司在机器学习、生物工程和医学交汇处工作,重点是蛋白质设计。
“从第一天起,我们就一直在研究蛋白质的生成模型。这就是为什么我们的名字是Generate!” Generate:Biomedicines的联合创始人兼首席技术官Gevorg Grigoryan博士兴奋地说。
在AI革命之前,蛋白质设计方法仅限于基于自然界现有蛋白质的设计,这存在局限性,因为自然只是对可能的蛋白质景观的一小部分进行了采样。相比之下,生成型AI方法强调从零开始的蛋白质设计——从头开始设计新蛋白质——以扩展功能和理想属性的范围,超越自然所达到的水平。
Chroma被记录为在外部约束下设计蛋白质,这可能涉及对称性、子结构、形状,甚至自然语言提示。对Chroma生成的310种蛋白质进行的实验表征结果显示,这些蛋白质表达、折叠,并具有良好的生物物理特性。
Grigoryan指出,从一开始,程序性就是Chroma框架的一个内在部分,因为产生治疗应用需要的不仅仅是生成可以实验验证的结构。评估蛋白质的功能,如结合、异构控制和酶活性,对治疗潜力至关重要。
此外,Grigoryan强调,这项研究的一个新颖之处在于在进行蛋白质设计活动时,实验验证思维方式的转变。
“与其目标是‘我想让蛋白质起作用’,我们的目标是对模型进行表征。我们想了解Chroma学到的东西有多少是真实的,”Grigoryan在接受GEN采访时说。
在决定哪些计算结构进行实验验证时,常见的方法是一个过滤步骤,其中蛋白质设计师根据对生物物理结构的理解来评判设计,例如由于溶解性问题而对疏水区域的过度代表性进行惩罚。
Grigoryan告诉GEN,选择进行实验验证的310种蛋白质是直接从模型输出中取得的,并未以这种方式进行过滤。
“从这些蛋白质中,我们看到了极高的成功率,这当然非常令人兴奋,因为它表明由Chroma参数化的这个大型蛋白质空间是真实的[并且允许更有效的蛋白质设计],”Grigoryan继续说。
让数据为您服务 蛋白质设计领域传统的“自下而上”方法,基于原子的生物物理动力学模拟