PNAS前沿:迈向作为多层学习的进化理论
导语
进化、学习与物理系统的重整化有何相似之处?PNAS的论文“构建将进化视作多层学习的理论”一文,经由统一的理论框架,分析进化过程中的环境预测误差,及学习过程中的信息流,推出了更一般的分子生物学中心法则。
研究领域:中心法则,生物进化
郭瑞东 | 作者
邓一雪 | 编辑
论文题目:
Toward a theory of evolution as multilevel learning
论文地址:
https://www.pnas.org/content/119/6/e2120037119
1. 进化理论面对的挑战
1. 进化理论面对的挑战
按照NASA的定义,生物是能够进行达尔文式进化的、有自我维持能力的化学系统。但该定义中的进化过程本身预设了复杂性的存在,遗传物质(DNA或RNA)的稳定复制本身就需要合适的环境(修复酶)。追根究底,为何会出现适合进化过程产生的环境?什么是进化所必需的条件呢?回答不应该是进化过程本身,否则就会陷入先有鸡还是先有蛋的争议。
进化理论的第二个问题是:进化无法解释为何生命会诞生,为何生物体中的层级化组织会产生?进化关注群体层面的突变频率改变,但对生物个体进化过程中偶然出现的决定性转变(major transitions in evolution),例如多细胞生物、社会性合作种群的出现,却不能给出合适的解释。
传统的进化理论将进化看成是一个最优化过程,但对于多细胞生物来说,进化的过程不仅仅是最优化,还涉及不同层级上的权衡。具体地展示,首先是细胞的复制次数和速率有其上限,否则就会危害生物体整体的生存(比如癌细胞),其次是生物体和其寄生生物之间的军备竞赛。这些需要生物体在不同层级之间进行权衡,而对该权衡的回答,是促成复杂又多样的万千生物的关键因素。
要应对上述挑战,需要将进化过程放在一个更一般的框架下,从而指出生命的诞生只是非遍历(nonergodicity)过程中的特殊现象。就像只有将人类看成哺乳动物的一种特例,才能破除人的特殊性,从而更好地理解人类。新框架下,神经网络的学习、物理系统的重整化和生物进化,都是更一般过程的一种特例。
2. 使进化可能的7条原则
2. 使进化可能的7条原则
正如欧式几何从几条公理出发,生物进化在满足以下7个条件的宇宙,将不仅是可行的,还可能是必然出现的。满足了这些条件后,宇宙间必然会诞生观察者,复杂性也必然会涌现。观察者的出现不必涉及意识,单细胞生物体也会预测环境并做出反应,因此任何生物体都应该看成观察者。将观察视作进化的先决条件,以下的7条原则可以看成使观察可能的先决条件。
7. 信息流。在不断发展的系统中,变化较慢的级别在学习过程,可以从变化较快的层级吸收信息,并将信息传递给变化较快的级别,以预测环境和系统本身的状态。
从整个宇宙的尺度来看,在众多可能的宇宙中,稳定性就可以看成是一个损失函数,经由试错,宇宙试图最优化这一函数,由此宇宙中的某一部分的演化,都可以看成宇宙演化的一个特例。而产生类似复杂生物体,则需要满足之后的几条原则。正因为存在快速变化和缓慢变化的两类变量,才需要出现层级化的组织结构。而可重整化的描述,使系统可以通过粗粒化表达,用少量变量来描述复杂的系统动力学,这使得生物体可以利用不完整的观察,做出对生存有益的预测。而如果描述系统动力学的变量,以相同的频率运行,生物体进行宏观预测时,必需同时了解其微观状态,在这样的宇宙中,只有学会了量子力学的生物体,才能进化出对生物有利的特征。
后三条是复杂生物出现的必须条件,当环境的变化速度,比生物体学习新信息的速度更快时,进化将变得不可能,第五点实际上指生物所处的环境是相对稳定的。第六条与频率间隙相对,正是由于不同层级的信息频率不同,因此不同层级需要有相对独立复制的信息处理单元。而不同层级间的信息交换,则是重整化得以进行的物质基础。
3. 用进化的7条原则,
解释进化中的关键事件
3. 用进化的7条原则,
解释进化中的关键事件
通过上述的7条原则,可以将进化过程中的里程碑事件的出现给予解释,并将进化过程和学习过程联系起来。例如细胞是生物体最基本的信息处理单元(IPU),其区分了自身和外界环境,并通过层级化的组织,构建了生物复杂性。从前四条原则,可以预测IPU一定会出现。将变化相对较慢的生物体,和变化较快的环境区分开,能够促成利用环境中的有用资源,并通过刺激和反应生成信息流。
在自旋玻璃物理中,非遍历且具有长历史的系统,会出现frustration(停滞)的状态。在生物体中,相互冲突的驱动会使生物呈现多样性和复杂性。这一现象的出现,其物理基础在于层级化的组织,而频率间隔的存在,使得生物体可以找到多个在适应函数上位于相同值的不同状态,而非遍历的演化动力学,是复杂系统的一个核心特征。在神经网络中,同样存在最优化停滞的鞍点。
为了克服进化中的停滞状态,可以引入随机性,但随机波动并不能保证生物体找到最优值,也不能确保其停留在最优值上。其结果就是众多不完美的设计,这在生物进化中经常出现。在进化理论中,该现象被称为适应度景观是粗糙的,而在机器学习中,该现象被称为存在多个局部最优。生物体引入随机性的方式,包括基因漂变,而在机器学习中,则是随机梯度下降。
由于重整化的存在,使得生物的信息处理过程中,不存在特定的最优层。这意味着生物体在不同层级间的控制,是在该层进行的。细胞的活动由基因决定,细胞形成的组织的动力学,由细胞间的互作决定,而最高层的生态系统的行为,由多个种群之间的食物链决定。这意味着存在多个管控层级。
重整化和信息间隔,使得生物体需要将信息存储和信息处理分离,即表型(连续的细胞形态)和基因型(稳定的离散信息)是相互分离的(DNA到RNA再到蛋白质的中心法则),即使对于以RNA为信息载体的原始生物,也是如此。在计算机中,冯诺依曼架构中,存储和计算单元的分离,也是基因型和表现型分离的一种体现。
层级化的信息处理以及重整化,使得生物体在进化过程中,会产生搭便车的寄生体。清除寄生信息的成本,由于不同层级的信息频率存在间隔,而变得过于高昂,这使得即使那些对生物体存活没有帮助的寄生编码也能存活。但长久来看,这些寄生的信息,可以为进化提供随机性,还可能促成有利的共生关系,线粒体、叶绿体的出现,都是这一共生关系的典范。
信息单元的复制以及可扩展性,预示着单个信息处理单元的寿命必须是有限的,低层级的信息处理单元,通过复制产生能够更好的从环境中获取负熵的单元后,就会自然走向死亡,从而以低层级的牺牲,促成高层级进一步优化损失函数。这解释了生物体细胞层面的预设死亡(programed death),也解释了为何会出现年老的大象为了象群自杀。
4. 生物体的中心法则背后的信息流
4. 生物体的中心法则背后的信息流
通过将进化,看成是学习过程,可以使用数学模型对生物体中非对称的信息流进行分析。如下图所示:其中环境的信息以及生物的基因型(个体存活的时间范围内)都是无法被训练的,浅绿色代表环境中,对损失函数不产生影响的因素,能够改变的只有中间的表型以及表型和环境之间的连接。
将进化过程看成是神经网络的训练过程的示意图
通过该框架,可以解释进化为何促成了复杂性的涌现。相比自组织临界(SOC),该框架能够整合生物和物理领域的众多现象,并符合达尔文式的进化过程。其中快速变化的信息处理动力学(直接和表型作用的蛋白质)和变化缓慢系统动力学(基因型的改变)是相互独立的。生物体通过基因中存储的信息对环境进行快速的预测和干预(产生蛋白质),但反向的信息传递,却不是发生在微观层面,而是宏观上的突变和选择,这一信息传递的不确定性,作者称其为广义的分子生物学中心法则。
用不严谨的类比来描述,缓慢变化的基因型,决定了进化这场游戏的规则,玩家在每场游戏中根据规则游戏,但如果游戏的规则对玩家不利,玩家会尝试改变游戏的规则。但相比没有游戏规则的玩家,在短时间内,按照规则游戏的收益更大,因此玩家在短期内不会破坏游戏规则。
总结全文:通过将进化看成是学习过程,可以从最基础的7条观察开始,对进化过程中的现象给与解释,并在生物和非生物之间,构建起一个统一的解释框架,从解释生命的起源。
复杂科学最新论文
集智斑图顶刊论文速递栏目上线以来,持续收录来自Nature、Science等顶刊的最新论文,追踪复杂系统、网络科学、计算社会科学等领域的前沿进展。现在正式推出订阅功能,每周通过微信服务号「集智斑图」推送论文信息。扫描下方二维码即可一键订阅:
推荐阅读
-
什么是涌现进化 | 集智百科 -
蛋白质的动力学和进化之间的对应关系:两个不同时间尺度下的相同故事 -
李飞飞提出深度进化强化学习新框架:创建具身智能体学会动物进化法则 -
深度学习首次验证进化数学模型:趋同演化增加生物多样性 -
《张江·复杂科学前沿27讲》完整上线! -
成为集智VIP,解锁全站课程/读书会 -
加入集智,一起复杂!
点击“阅读原文”,追踪复杂科学顶刊论文