前沿进展:通过层次结构信息和分子动力学模拟发现高活性肽
导语
彭璐 | 作者
论文题目:Discovery of Highly Bioactive Peptides through Hierarchical Structural Information and Molecular Dynamics Simulations 论文链接:https://doi.org/10.1021/acs.jcim.4c01006 作者:李舒#,彭璐#,陈柳青#,阙林婕,康文青清,胡晓俊,马军,狄增如,刘宇*
一、多肽药物的潜力与挑战
一、多肽药物的潜力与挑战
在面对这个庞大的多肽药物设计空间时,通常面临着两个关键问题:
1. 如何从海量的可能组合中发现高效、特异性强的多肽药物?
目前多肽药物设计的方法
在多肽药物设计中,有几种常见的计算方法,分子对接用于预测肽与靶蛋白的相互作用,类似于为钥匙寻找合适的锁,从而筛选出可能有效的肽药物。分子动力学模拟(MD)则帮助研究人员更深入地观察多肽在生物环境中的动态行为,比如与靶蛋白的结合过程和结构变化。虽然这些方法有效,但在使用时往往耗费大量的计算资源,且在处理复杂分子时效率不高。
近年来深度学习也进入了多肽药物设计领域。通过神经网络,研究者可以自动生成新肽分子,像是让机器学习如何“设计”药物。然而,深度学习方法常常需要大量高质量的数据来训练模型,而且由于其“黑箱”特性,研究人员很难理解模型的内部工作原理。
二、PepHiRe——通过
“梯径方法”寻找抗癌多肽药物
二、PepHiRe——通过
“梯径方法”寻找抗癌多肽药物
为什么是梯径(Ladderpath)?
通过梯径方法解构BH3肽
PepHiRe的架构
PepHiRe的工作流程可以分为三个主要步骤:
① 生成新肽序列:利用梯径方法从8种已知的高效BH3肽序列中提取结构信息,生成一系列新的多肽候选序列。这些新生成的多肽序列都具有潜在的与MCL-1结合能力。
② 筛选多肽:通过预测这些多肽的螺旋结构潜力(即它们能否形成α螺旋),与目标蛋白分子对接结果来筛选出表现最佳的多肽。通过这一过程,我们能够选出与MCL-1结合最紧密的多肽。
基于梯径方法生成新肽
基于梯径方法生成新肽的步骤
随着迭代,设计的多肽性能提升
BH3样肽的生物活性验证
三、使用PepHiRe设计抗菌肽
三、使用PepHiRe设计抗菌肽
PepHiRe与经典方法的对比
在广阔的多肽空间中寻找有效序列是一项复杂的任务,PepHiRe通过缩小搜索范围,提高了效率。为验证其效果,我们也将PepHiRe与两种经典方法进行了比较:单点突变法和遗传算法(GA)。
单点突变法通过对已有多肽序列的单个氨基酸进行随机突变生成新多肽。对于同样的任务,从8条已知BH3多肽序列开始,经过迭代生成新序列,同PepHiRe一样也会选出得分最高的多肽加入初始库。结果显示虽然评分有所提升,但新多肽的螺旋结构并未显著改善,且生成的多肽与原始多肽非常相似,仅在少数位置发生变化,说明此方法的探索范围有限,难以有效扩展到更广泛的多肽空间。
遗传算法通过模拟生物进化生成新多肽,具体操作包括交叉和突变,生成并筛选新序列。从8条已知BH3多肽序列开始,虽然螺旋性在迭代过程中逐步提高,但对接评分的提升并不显著,表现完全不如PepHiRe或单点突变法。虽然生成的多肽序列可能比单点突变法更具多样性,但与PepHiRe相比仍显不足。另外,遗传算法需要对更多的多肽进行对接评分,运行速度比其他方法慢了数倍。
结语
结语
这项工作是基于梯径方法的第五篇研究。之前的研究包括:
-
第二篇在《Entropy》发表,正式提出了梯径方法的概念和基本算法,揭示了如何通过“修修补补”的方式增加复杂性和信息量。
-
第四篇发表在《npj Complexity》,则将梯径方法用于神经网络,分析其结构复杂度与功能表现的关系。
关于代码和数据 PepHiRe的源代码可在https://github.com/yuernestliu/pephire免费获取。其中还包括MD模拟的输入文件和输出轨迹、初始配置、拓扑结构、参数、模拟条件以及相应的轨迹文件。
[1] Jacob, F. Evolution and tinkering. Science 1977, 196, 1161−1016.
[2] Zhang, Z.; Liu, C.; Zhu, Y.; Peng, L.; Qiu, W.; Tang, Q.; Liu, H.; Zhang, K.; Di, Z.; Liu, Y. Evolutionary tinkering enriches the hierarchical and nested structures in amino acid sequences. Phys. Rev. Res. 2024, 6 (2), 023215.
[3] Xu, Z.; Zhu Y.; Hong B.; Wu X.; Zhang J.; Cai M.; Zhou D.; Liu, Y. Correlating measures of hierarchical structures in artificial neural networks with their performance. npj Complexity 2024, 1, 15.
[4] Liu, Y.; Di, Z.; Gerlee, P. Ladderpath approach: How tinkering and reuse increase complexity and information. Entropy 2022, 24 (8), 1082.
[5] Liu, Y.; Mathis, C.; Bajczyk, M. D.; Marshall, S. M.; Wilbraham, L.; Cronin, L. Exploring and mapping chemical space with molecular assembly trees. Sci. Adv. 2021, 7, No. eabj2465.
AI By Complexity读书会
大模型、多模态、多智能体层出不穷,各种各样的神经网络变体在AI大舞台各显身手。复杂系统领域对于涌现、层级、鲁棒性、非线性、演化等问题的探索也在持续推进。而优秀的AI系统、创新性的神经网络,往往在一定程度上具备优秀复杂系统的特征。因此,发展中的复杂系统理论方法如何指导未来AI的设计,正在成为备受关注的问题。
集智俱乐部联合加利福尼亚大学圣迭戈分校助理教授尤亦庄、北京师范大学副教授刘宇、北京师范大学系统科学学院在读博士张章、牟牧云和在读硕士杨明哲、清华大学在读博士田洋共同发起「AI By Complexity」读书会,探究如何度量复杂系统的“好坏”?如何理解复杂系统的机制?这些理解是否可以启发我们设计更好的AI模型?在本质上帮助我们设计更好的AI系统。读书会于6月10日开始,每周一晚上20:00-22:00举办。欢迎从事相关领域研究、对AI+Complexity感兴趣的朋友们报名读书会交流!
6. 加入集智,一起复杂!
点击“阅读原文”,报名读书会