关键词:蛋白质演化动力学,适应性进化,适应性景观
A rugged yet easily navigable fitness landscape
https://www.science.org/doi/10.1126/science.adh3860
适应性景观(fitness landscape)是进化生物学中的一个基本概念,也用于研究多个其他学科中的复杂优化问题。它类似于物理景观,其中一个位置对应于基因型,该位置的高度对应于具有该基因型的生物体的适应性。达尔文式进化可以被视为生物体对这样一个景观的探索,其中最高峰对应于适应性最强的生物体。当 Sewall Wright 于1932年提出景观概念时,他担心生物适应性景观可能存在着数量庞大的高峰,其中大部分可能适应性较低。在这样的景观中,进化中的种群很可能被困在低适应性的山峰上,自然选择无法帮助其逃脱。在 Wright 的发现之后近80年时间里,几乎所有关于景观的研究都是理论性的,尽管现在实验性的景观研究越来越频繁,我们仍然不知道崎岖的景观是否会影响适应性进化。
为了实验性地解决这个基本问题,这项研究通过 CRISPR-Cas9 基因编辑大肠杆菌的关键代谢基因 folA,该基因编码二氢叶酸还原酶,从而创建了一个大型生物适应性景观(>260,000个突变体)。研究通过让三个氨基酸位置的九个核苷酸(这些位置可以赋予临床抗生素磺胺甲恶唑耐药性)突变,绘制了这种酶的适应性景观。研究在含有抗生素的环境中传代了所有 folA 变体的六倍复制突变体库,并使用深度测序获得了近99.7%的所有序列变体的适应性估计。这些几乎组合完整的数据使得能够确定这个高维度景观的崎岖程度。研究确定了其适应性高峰、吸引盆地以及通往这些高峰的进化可达路径。为了找出崎岖的景观是否会影响适应性进化,研究者在这个景观上模拟了不同种群遗传学情景下的进化动力学。
研究发现适应性景观非常崎岖。它有514个适应性高峰,其中大部分适应性较低。尽管如此,该景观具有平滑景观的多个特性。其中包括大量通往高适应性高峰的适应性单调递增路径,这些高峰具有大的吸引盆地,并且超过75%的进化种群可以轻松到达这些高峰。此外,大多数进化种群可以访问多个高适应性高峰。所有74个高适应性高峰有效地共享一个巨大的吸引盆地(104,496个变体)。这导致分子层面上进化的可预测性较低,因为每个种群可以选择通往不同高适应性高峰的多条替代路径。高适应性高峰仍然是可达的,不受景观上不同进化动力学的影响。
该研究表明,在现实的高维度和崎岖的适应性景观上进行适应性进化可能比普遍认为的更容易。这些研究发现呼吁提出新的改进理论,以理解现实中高维度适应性景观的反直觉几何特性。
图:二氢叶酸还原酶的实验性适应性景观。研究中编辑了大肠杆菌基因组,以创建一个包含所有643个密码子的适应性景观,这些密码子编码蛋白质二氢叶酸还原酶中的三个连续氨基酸(A,丙氨酸;D,天冬氨酸;L,亮氨酸)。通过质量选择实验和深度测序测量了该景观中每个基因型在抗生素磺胺甲恶唑存在下的适应性。尽管该景观非常崎岖,但适应性进化可以通过短而丰富的适应性增加路径从大多数起始位置找到最高峰。
集智斑图顶刊论文速递栏目上线以来,持续收录来自Nature、Science等顶刊的最新论文,追踪复杂系统、网络科学、计算社会科学等领域的前沿进展。现在正式推出订阅功能,每周通过微信服务号「我的集智」推送论文信息。扫描下方二维码即可一键订阅: