导语


DNA和蛋白质是承载遗传信息的生物大分子,通过编码调控生命中的结构参与一系列物理和化学过程,构成了生命的基本蓝图。然而,动态的遗传、演化机制具有路径依赖性,生命的分子基础在迭代过程中受限于它们与环境交互的方式与速度,这对我们在应对突发传染病,环境恶化,生物智造等问题时构成了极大限制。当今生命科学与分子工程学的前沿问题之一即是如何有效探索广大的可编译遗传序列空间,根据新的需求和应用场景设计产生功能分子和结构、从而调节生命过程,这对人类健康与可持续发展都有积极意义。


本次分享,我们邀请了来自华盛顿大学蛋白设计中心博士后研究员王顺智以及普渡大学计算机系博士生王虓来对AI与蛋白质实验构建和设计相关的最新工作进行分享和讨论。


集智俱乐部联合西湖大学助理教授吴泰霖、斯坦福大学计算机科学系博士后研究员王瀚宸、博士研究生黄柯鑫、黄倩,华盛顿大学博士研究生屠鑫明,共同发起以“大模型与生物医学”为主题的读书会,共学共研相关文献,探讨基础模型在生物医学等科学领域的应用、影响和展望。读书会从2023年8月20日开始,每周日早上 9:00-11:00 线上举行,持续时间预计8周。欢迎对探索这个激动人心的前沿领域有兴趣的朋友报名参与。





基于深度学习的大分子结构检测与建模




在生命科学中,确定蛋白质和蛋白质复合物等大分子结构至关重要,因为这些分子在细胞内发挥着关键作用。大分子的具体物理相互作用主导了分子和细胞功能,因此解析这些实体的三维结构对于理解生命过程、疾病和药物发现机制至关重要。冷冻电子显微镜(cryo-EM)已经成为一种有望用于获取三维大分子结构的实验技术。

长久以来,囿于实验方法的限制和显微镜的分辨率,确定大分子结构,尤其是多链蛋白质分子一直以来都是一个非常费时费力的工作。随着深度学习和冷冻电镜技术的出现,为自动化大分子建模提供了可能。

本次交流,我将主要讨论我们近期在蛋白质,DNA/RNA大分子建模的研究进展,包括如何从低分辨率冷冻电镜进行蛋白质和DNA/RNA识别,如何基于高分辨率冷冻电镜进行蛋白质,DNA/RNA建模。


1. 背景简介

a. 中心法则
b. 冷冻电镜背景

c. 大分子多级结构

2. 研究分享#1 – 基于深度学习的大分子结构检测:

a. 问题:如何在冷冻电镜图像中预测
b. 方法:深度学习网络检测

c. 结果:蛋白质二维结构,氨基酸,原子,DNA/RNA结构识别

3. 研究分享#2 – 蛋白质结构评估:

a. 问题:如何确定蛋白质结构是否正确
b. 方法:结合深度学习检测结果从多个方面分析蛋白质结构

c. 结果:蛋白质结构评估软件,蛋白质结构评分数据库

4. 研究分享#3 – 蛋白质,DNA, RNA结构自动建模:

a. 问题:如何自动化的从冷冻电镜图像中建立大分子结构?
b. 方法:基于深度学习和VRP算法的自动化建模

c. 结果:自动化蛋白质,DNA,RNA建模

5. 总结与展望





计算蛋白质设计:从AlphaFold到强化学习




长久以来,囿于物理模型的精度,我们对丰富且复杂的蛋白-蛋白、DNA-蛋白相互作用的研究进展受困。但这一僵局在近年被基因与蛋白组学的快速发展与AlphaFold的横空出世打破。基于大数据训练的深度学习模型不断挖掘序列信息-3维结构-生物功能的构效关系,驱动了计算蛋白质的结构预测与从头设计(de novo)的高速发展,并不断被实验所验证。这些突破让我们看到湿实验与AI有机结合的诸多成功案例,正在重新塑造基础科学的信息化研究新范式。

本次交流,我将主要讨论我们近期在计算蛋白质设计领域的研究进展与思考,包括如何在蛋白设计种引入强化学习算法,设计类似病毒的多聚体蛋白质衣壳 – 作为潜在的信号通路及疫苗载体;以及设计可在细胞内表达的新型自组装蛋白晶体材料;还有如何构筑简化版的光合作用相关体系。这些探索不仅涉及新的生物材料以及潜在的技术应用,更重要的是还为我们带来了一系列新的设计思路与工具用于驱动基础科学的新发现。


6. 背景简介

a. 人工智能从游戏到助力科学
b. 遗传序列作为1维信息编码了生命过程中的结构与功能
c. 生命科学中自组装的分子基础

d. 蛋白质的从头设计背景简介

7. 研究分享#1 – 自上而下蛋白质组装提设计:

a. 问题:如何在几何约束条件下创建高度互补可设计的蛋白骨架
b. 方法:强化学习探索优化采样结构空间

c. 结果:从头设计正二十面体类病毒颗粒

8. 研究分享#2 – 计算设计3D蛋白质晶体:

a. 问题:如何通过计算将不规则结构蛋白质在3维空间自组装结晶
b. 方法:逐层组装降低系统自由度,优化蛋白-蛋白界面二级结构相互作用

c. 结果:3种从头设计晶体,与计算模型接近原子尺度吻合,可在细胞内结晶

9. 研究分享#3 – 计算设计全新叶绿素结合蛋白用于人造光和作用:

a. 问题:把叶绿素装进冰箱蛋白质,总共分几步?
b. 方法:小分子与蛋白侧链基团相互作用预测,局部构象嵌套入工程骨架

c. 结果:叶绿素结合二聚体蛋白可用于能量转移,含叶绿素纳米蛋白笼。

10. 总结与展望





主讲人介绍




王顺智现任华盛顿大学蛋白设计中心博士后研究员,合作导师为David Baker教授。研究方向为生物大分子的可编程自组装,涵盖计算蛋白质设计,DNA纳米技术,生物-无机界面化学。王顺智先后在美国北卡莱罗纳教堂山分校和西北大学获得化学学士和博士学位,博士导师为Chad Mirkin教授。代表工作包括发现DNA胶体晶体中的类电子颗粒,基于强化学习自上而下设计蛋白质组装体,从头设计3维蛋白晶体等。系列研究成果在Science, Nature Materials, J. Am. Chem. Soc., Nature Communications, Advanced Materials 等期刊发表。

王虓现为普渡大学计算机系博士生,指导导师为Daisuke Kihara教授,研究方向为生物大分子自动建模,涵盖蛋白质预测,DNA/RNA建模,以及蛋白质复合物预测和评估。代表工作为基于深度学习的蛋白质结构建模,DNA/RNA结构建模。系列研究成果发表在Nature Methods, Nature Communications等期刊。




参与方式




活动时间

2023年9月10日(本周日)上午10:00-12:00


线上会议室

扫码参与大模型与生物医学读书会,加入群聊,获取系列读书会回看权限,成为大模型与生物科学读书会的种子用户,与社区的一线科研工作者与企业实践者沟通交流,共同推动AI+Science社区的发展。



参考文献

(1) Li, Z.;† Wang, S.;† Nattermann, U.;† Bera, A. K.; Borst, A. J.; et al. Accurate Computational Design of 3D Protein Crystals. Nat. Mater. 2023, accepted. Doi: https://doi.org/10.1101/2022.11.18.517014. († equal author contribution)

(2) Lutz, I. D.;† Wang, S.;† Norn, C.;† Courbet, A.; Borst, A. J.; et al. Top-down Design of Protein Architectures with Reinforcement Learning. Science 2023, 380 (6642), 266–273. https://doi.org/10.1126/science.adf6591.

(3) Watson, J. L.;† Juergens, D.;† Bennett, N. R.;† Trippe, B. L.;† Yim, J.;† et al. De Novo Design of Protein Structure and Function with RFdiffusion. Nature 2023, 620 (7976), 1089–1100. https://doi.org/10.1038/s41586-023-06415-8.

(4) Dauparas, J.; Anishchenko, I.; Bennett, N.; Bai, H.; Ragotte, R. J.; et al. Robust Deep Learning–Based Protein Sequence Design Using ProteinMPNN. Science 2022, 378 (6615), 49–56. https://doi.org/10.1126/science.add2187.

(5) Ennist, N.; Wang, S.;  Kennedy. M. A.; Curti, M.; et al. ” De novo design of energy transfer proteins housing excitonically coupled chlorophyll special pairs,” Nat. Struct. Biol. 2023, Accepted. Doi: https://www.researchsquare.com/article/rs-2736786/v1 

1. Wang, X., Alnabati, E., Aderinwale, T. W., Maddhuri Venkata Subramaniya, S. R., Terashi, G., & Kihara, D. (2021). Detecting protein and DNA/RNA structures in cryo-EM maps of intermediate resolution using deep learning. Nature Communications, 12(1), 2302.

2. Maddhuri Venkata Subramaniya, S. R., Terashi, G., & Kihara, D. (2019). Protein secondary structure detection in intermediate-resolution cryo-EM maps using deep learning. Nature Methods, 16(9), 911-917.

3. Terashi, G.*, Wang, X.*, Maddhuri Venkata Subramaniya, S. R., Tesmer, J. J., & Kihara, D. (2022). Residue-wise local quality estimation for protein models from cryo-EM maps. Nature Methods, 19(9), 1116-1125.

4. Tsukasa Nakamura, Xiao Wang, Genki Terashi, & Daisuke Kihara, DAQ-Score Database: assessment of map-model compatibility for protein structure models from cryo-EM maps, Nature Methods, 20: 775-776, (2023).

5. Xiao Wang, Genki Terashi & Daisuke Kihara, CryoREAD: De novo structure modeling for nucleic acids in cryo-EM maps using deep learning. Nature Methods (2023).

6. Genki Terashi, Xiao Wang, Devashish Prasad, Tsukasa Nakamura & Daisuke Kihara, Integrated Protocol of Protein Structure Modeling for Cryo-EM with Deep Learning and Structure Prediction. Nature Methods (2023).

7. Terashi, G., & Kihara, D. (2018). De novo main-chain modeling for EM maps using MAINMAST. Nature Communications, 9(1), 1618.

8. Han, X., Terashi, G., Christoffer, C., Chen, S., & Kihara, D. (2021). VESPER: global and local cryo-EM map alignment using local density vectors. Nature Communications, 12(1), 2090.


(参考文献可上下滑动查看)



大模型与生物医学:

AI + Science第二季读书会启动


生物医学是一个复杂且富有挑战性的领域,涉及到大量的数据处理、模式识别、理论模型建构和实验验证等问题。AI基础模型的引入,使得我们能够从前所未有的角度去观察和理解这个领域的问题,加速科学研究的步伐,提高医疗服务的效率和效果。这种交叉领域的合作,标志着我们正在向科技与生物医学深度融合的新时代迈进,对于推动科学研究、优化医疗服务、促进人类健康有着深远的影响。

集智俱乐部联合西湖大学助理教授吴泰霖、斯坦福大学计算机科学系博士后研究员王瀚宸、博士研究生黄柯鑫、黄倩,华盛顿大学博士研究生屠鑫明,共同发起以“大模型与生物医学”为主题的读书会,共学共研相关文献,探讨基础模型在生物医学等科学领域的应用、影响和展望。读书会从2023年8月20日开始,每周日早上 9:00-11:00 线上举行,持续时间预计8周。欢迎对探索这个激动人心的前沿领域有兴趣的朋友报名参与。


详情请见:

大模型与生物医学:AI + Science第二季读书会启动



AI+Science 读书会


AI+Science 是近年兴起的将人工智能和科学相结合的一种趋势。一方面是 AI for Science,机器学习和其他 AI 技术可以用来解决科学研究中的问题,从预测天气和蛋白质结构,到模拟星系碰撞、设计优化核聚变反应堆,甚至像科学家一样进行科学发现,被称为科学发现的“第五范式”。另一方面是 Science for AI,科学尤其是物理学中的规律和思想启发机器学习理论,为人工智能的发展提供全新的视角和方法。

集智俱乐部联合斯坦福大学计算机科学系博士后研究员吴泰霖(Jure Leskovec 教授指导)、哈佛量子计划研究员扈鸿业、麻省理工学院物理系博士生刘子鸣(Max Tegmark 教授指导),共同发起以“AI+Science”为主题的读书会,探讨该领域的重要问题,共学共研相关文献。欢迎对探索这个激动人心的前沿领域有兴趣的朋友报名参与。


详情请见:
人工智能和科学发现相互赋能的新范式:AI+Science 读书会启动



点击“阅读原文”,报名读书会