Science 速递：大语言模型对蛋白质结构进行演化尺度预测

2023-03-21 3,191 0

关键词：大语言模型，蛋白质结构预测，深度学习

论文题目：Evolutionary-scale prediction of atomic-level protein structure with a language model

论文来源：Science

论文链接：https://www.science.org/doi/10.1126/science.ade2574

语言模型有可能在整个进化过程中学习蛋白质序列的模式。这一想法促使人们对进化规模的语言模型进行研究，其中基本模型学习反映基础生物学方面的表征，并且随着表征能力的增强，在低分辨率下捕捉二级结构和三级结构。

Science 的这篇文章展示了使用大语言模型从主序列直接推断出完整的原子级蛋白质结构。研究人员构建 ESMFold，一个从序列到结构的预测器，其准确度几乎与基于对齐的方法一样，而且速度相当快。当蛋白质序列的语言模型被扩展到150亿个参数时，蛋白质结构的原子分辨率图就会在学习的表征中出现。这导致了高分辨率结构预测的数量级加速，从而实现了元基因组蛋白质的大规模结构特征。

这项研究应用这一能力构建了 ESM 元基因组图谱，预测了6.17亿个元基因组蛋白质序列的结构，其中包括2.25亿个高置信度的预测，这使我们看到了天然蛋白质的广阔性和多样性。

图1. 将语言模型扩展到 150 亿个参数时出现结构

图2. 使用 ESMFold 进行单序列结构预测

图3. 宏基因组序列的 ESMFold 结构预测示例

AI+Science 读书会启动

AI+Science 是近年兴起的将人工智能和科学相结合的一种趋势。一方面是 AI for Science，机器学习和其他 AI 技术可以用来解决科学研究中的问题，从预测天气和蛋白质结构，到模拟星系碰撞、设计优化核聚变反应堆，甚至像科学家一样进行科学发现，被称为科学发现的“第五范式”。另一方面是 Science for AI，科学尤其是物理学中的规律和思想启发机器学习理论，为人工智能的发展提供全新的视角和方法。

集智俱乐部联合斯坦福大学计算机科学系博士后研究员吴泰霖（Jure Leskovec 教授指导）、哈佛量子计划研究员扈鸿业、麻省理工学院物理系博士生刘子鸣（Max Tegmark 教授指导），共同发起以“AI+Science”为主题的读书会，探讨该领域的重要问题，共学共研相关文献。读书会从2023年3月26日开始，每周日早上 9:00-11:00 线上举行，持续时间预计10周。欢迎对探索这个激动人心的前沿领域有兴趣的朋友报名参与。

详情请见：

人工智能和科学发现相互赋能的新范式：AI+Science 读书会启动

推荐阅读

1. 能够预测蛋白质结构、控制核聚变的AI，怎样促进科学理解？

2. Nat. Commun. 速递：图神经网络预测单个蛋白质结构中隐藏口袋的位置

3. Nat. Comput. Sci. 速递：基于拓扑的蛋白质适应度框架

4. 《张江·复杂科学前沿27讲》完整上线！

5. 成为集智VIP，解锁全站课程／读书会

6. 加入集智，一起复杂！

点击“阅读原文”，报名读书会

Science 速递：大语言模型对蛋白质结构进行演化尺度预测

PNAS速递：社会复制导致非线性种群数量崩溃临界点

Nat. Commun. 速递：深度学习根据卫星图像检测全球垃圾场分布

发表评论点击这里取消回复。

统计物理基础

重整化群分析在非线性物理中的应用

复杂系统的涌现动力学

Koopman分析在非线性动力学中的应用

重磅系列课程：控制科学前沿理论与方法

复杂系统入门与实战（Python）

热门浏览

最新文章

一盏灯，为你而亮丨集智招全职or兼职运营助理

系统科学：超越相对论与量子力学的科学革命

推荐｜苇草智酷·智盟酷创计划

Nature子刊：非线性动力学最新论文合集

【会议通知】第二十一届中国科技政策与管理学术年会暨研究会理事会会议（第四轮）

Science 速递：大语言模型对蛋白质结构进行演化尺度预测

微信扫一扫,分享到朋友圈

PNAS速递：社会复制导致非线性种群数量崩溃临界点

Nat. Commun. 速递：深度学习根据卫星图像检测全球垃圾场分布

猜你喜欢

一盏灯，为你而亮丨集智招全职or兼职运营助理

系统科学：超越相对论与量子力学的科学革命

推荐｜苇草智酷·智盟酷创计划

Nature子刊：非线性动力学最新论文合集

【会议通知】第二十一届中国科技政策与管理学术年会暨研究会理事会会议（第四轮）

清华大学崔鹏教授首创基于因果推理的大模型——极数（LimiX）大模型丨集智百科

发表评论 点击这里取消回复。

统计物理基础

重整化群分析在非线性物理中的应用

复杂系统的涌现动力学

Koopman分析在非线性动力学中的应用

重磅系列课程：控制科学前沿理论与方法

复杂系统入门与实战（Python）

热门浏览

最新文章

一盏灯，为你而亮丨集智招全职or兼职运营助理

系统科学：超越相对论与量子力学的科学革命

推荐｜苇草智酷·智盟酷创计划

Nature子刊：非线性动力学最新论文合集

【会议通知】第二十一届中国科技政策与管理学术年会暨研究会理事会会议（第四轮）

关注我们的公众号

发表评论点击这里取消回复。