关键词:计算蛋白质设计,生成模型,扩散过程
Illuminating protein space with a programmable generative model
https://pattern.swarma.org/paper/db77c5a4-840a-11ee-8dba-0242ac17000e
https://www.nature.com/articles/s41586-023-06728-8
三十亿年的进化产生了极其多样的蛋白质分子,但蛋白质的潜在可能性可能远远超过现有的多样性。对于计算和实验来说,遍历这种可能性颇具挑战,因为蛋白质分子的概率空间,远远大于具有功能的蛋白质分子的概率空间。计算蛋白质设计领域旨在通过以可编程方式自动设计功能性蛋白质来缩短这个过程,过去三十年中已经取得了相当大的进展,包括设计先前未知的拓扑结构、装配体、结合物、催化剂等,但大多数全新设计的蛋白质仍然无法接近自然界中蛋白质的复杂性和多样性。
最近发表于Nature的一篇研究,提出了一种名为Chroma的蛋白质和蛋白质复合物生成模型,它可以直接采样新颖的蛋白质结构和序列,并且可以通过条件设置来引导生成过程以实现所需的性质和功能。对310个蛋白质的实验表征表明,从该模型采样得到的蛋白质具有高表达、折叠和有利的生物物理性质。
Chroma通过引入扩散过程、神经网络架构和可靠的采样算法,实现了高保真、高效的蛋白质生成。预计未来,此类可扩展的生成模型将大大提高设计和构建适合功能的蛋白质系统的能力,并迅速推广应用。
图1 Chroma模型示意图,它将蛋白质主链的结构扩散与可扩展的分子神经网络相结合,用于主链合成和包含所有原子的结构设计。
大模型与生物医学:
AI + Science第二季读书会启动
详情请见:
大模型与生物医学:AI + Science第二季读书会启动