导语

个体之于群体,如滴水之于百川。但在对生命本质的探索中,一些概念模糊不清,究竟什么才是生命个体?个体与环境的边界在哪里?5月15日,由集智俱乐部、苇草智酷、信息社会50人论坛举办的《生命是什么?——从圣塔菲研究所“个体信息论”谈起》【云上思想】研讨会就这一问题展开了分析。期间,北京师范大学系统科学学院张江教授做了题为《生命自主体理论一瞥》的专题分享。以下是报告纪要。



什么是生命?


生命是什么?这个问题大家可能都思考过,这个问题可能说是“灵魂拷问”,不仅仅是针对每一个生命体都非常重要,它直接也促成了我们生命科学,特别引发物理学家、计算机学家、数学家对生命大问题联合的拷问。

之前最早提出这个问题的人是薛定谔,他是一个典型的物理学家。但是在他撰写的书《What is Life》里却把这个问题摆在了这些物理学家和数学家面前,这激励着大量绝顶聪明的人士开始思考这一问题。
 
图1:书籍《What is Life
 
薛定谔当年他的洞察最重要的是两点:

第一点,生命体一个非常重要的特征就是要保持新陈代谢:从物理的角度来说新陈代谢就是在摄取负熵流;

第二点,生命体要完成自复制:而从物理的角度来说这一定是需要一种准晶体来去实现自复制过程,这也就促成了后来的 DNA 双螺旋结构的发现。

不过,从第一点来说,新陈代谢实际上并没有得到一个像双螺旋结构那样普适的理论。因此我们的讨论可以从“生命体如何维持一个稳定的结构”这一问题展开。
 
这就牵扯到一个所谓的个体之迷的问题:当我们看到一个小虫子在地上爬——动动腿就能跑。这样一个虫子和屏幕上动来动去的鼠标有一个非常本质的不同。因为这个小虫子有一个自我,这个虫子为了达成自我吃食的目的,会主动在环境里面朝向食物运动。
 
这样一种有自我意识的生命主体是怎样起源的?这就是我们所说的个体之迷


个体之迷的四种解释


这个谜团跟所谓自我涌现其实是紧密不可分的,这也是该问题归属于复杂性科学的重要原因。因为复杂性科学就是要回答涌现从何而来。所以我们就要试图回答,自我这个概念是如何自下而上涌现出来的。
 
除了传统的生物学视角以外,我们可以从建模的视角去回答这个个体之迷。具体而言又分为了四个方向。图灵机、自创生与自催化、个体信息论、涌现层次问题。
 
第一是个体之迷的回答,其实可以追溯到图灵机模型。当然图灵机模型可以回答一部分问题,但是有更多的问题无法回答。
 
后来就有了圣塔菲学派的 Kauffman,以及 Marturana 和 Varela 两个智利的生物学家,他们从开始从另一个角度去考虑主体如何从自下而上涌现而出的这种自创生、自催化的组织是怎么出现的。自创生、自催化这个方向走到后期,就会发现研究不得不再次停滞不前。因为自创生、自催化这些组织很神奇,它是涌现出来的。但是,它的一个缺点是很难界定个体的边界。
 
新的方向是,如何针对这样一种组织,如何通过数学的方式来去定量刻画。这也就是个体信息论。

最后,生命是一个多层次的复杂系统。一个层次的生命涌现后并不会停止,存在多层次的涌现,这也是对未来研究的展望。



图灵机:最早的个体模型


说回图灵机模型,1937年图灵就发表了一篇论文 On Computable Numbers, With an Application to the Entscheidungsproblem,这篇论文直接提出了图灵机模型,它是一个超级简单的冯·诺伊曼的计算机。今天的计算机能做的事图灵机都能做,图灵机如何运作其实它元件非常简单,就是一个长长的纸带,这有一个读写头,然后这个读写头会根据一个固定的规则表和字母表,然后在纸带上划来划去,同时也可以改写纸上的内容。它的操作是超级简单,但是图灵机的表现可以非常复杂。通过简单地设置图灵机规则表,就可以让它去近似模拟一些简单的生命体行为。
 
朗顿的蚂蚁是一个著名的图灵机模型。
 
图2:朗顿的蚂蚁
 
这个图灵机是一个二维的方格世界里面游走的蚂蚁。它遵循两条规则:第一,如果遇到当前格子为白,右旋转90°,把格子涂黑,往前移动一个格子。第二,如果遇到当前格子为黑,左旋转90°,把格子涂白,往前移动一个格子。就这么一个简单的规则。它可以绘制出来非常复杂的行为和图形。以此类推,我们可以通过添加简单的规则,利用图灵机去模拟生命现象。
 
图灵机的优点就是通用计算能力(Universal Computation),我们的任何计算模型包括 AlphaZero 都可以转变为图灵机的模式。只要一个模型是可计算的,我们就可以说它和图灵机是等价的。这一理论被称之为 Church-Turing Thesis。
 
当然图灵机也有缺点,首先最大的瓶颈就是,它是一个串行化的模型。因为我们知道它是一个蚂蚁,蚂蚁就相当于一个读写头,这个读写头只能够串行在这个纸带上走来走去。实际上我们人体是由一堆细胞构成的,每一个细胞都可以看成是一个图灵机,这些细胞都是在并行操作,不是串行。
 
第二个是具身性问题。图灵机它忽略了所有细胞接触到的信息,直接把我们大脑的认知系统看成一个串行单体。只对这个单体来建模,而忽略了身体每一个毛孔都是跟外界进行物质能量信息的交换。这部分输入进来的信息被图灵机舍弃了。因此,它实际上是一个裸大脑的图灵机,不具备所谓的身体。至于,是不是能这样抽象这个要做进一步的讨论了。
 
第三个缺点是图灵机这样一个个体它是如何起源的。前文提到的蚂蚁模型或者更复杂的图灵机,都是人类制定规则创造出来的图灵机。现实生命中却没有一个上帝创造者,而是一个自发起源的过程。一个图灵机模型是如何去起源的,这个问题没有回答。


生命的起源:自创生、自催化


新的研究角度就是科学家开始思考,一个类似于原始细胞的一个生命个体是如何自下而上的,而且是大量个体互相作用并行化的。从而,形成一个组织,而这个组织又是可以被看成是具有自我的主体。
 
这个问题其实更大,它直接牵扯到了生命起源问题。生命起源不是一个过程,实际上是若干个阶段:包括有化学物质的起源、前化学进化、细胞的起源好几个阶段。
 
研究者的关注点在于,假设化学物质它已经存在了,这个化学物质如何去构成一个完整的细胞的。这也是一个单个的细胞生命体是如何起源问题。对这个现象进行研究的一个最知名的理论,就是所谓的自创生理论(Autopoeisis)。是由智利的两名生物学家 Humberto Maturana 和 Francisco Varela 在 1970 年代创立的。
 
自创生理论(Autopoeisis)认为: 生物体就是一个复杂的化学网络,这个化学网络在每一个时刻都在不断地生成自己。
 
Humberto Maturana 和 Francisco Varela 给出了 Autopoietic 系统的两个条件:
  1. 这个生物组织具有生产闭合性“网络中的任意一个元素都被网络中的其它元素生产。换句话说,这整个的网络它所有的零部件全部都是自给自足的,满足一个自我闭环的特性;
  2. 网络中的化学元素不断地生成自己的边界,存在一个膜,从而使得边界内部的网络系统构成一个独立的整体。
 
只要面前这两条就可以构成一个原始的生命,原始的细胞。在这样一个定义里面实际上没有关于任何物质的构成这方面任何的限制。换句话说,这个网络你可以是由分子构成,也可以是由一个细胞构成,甚至可以由一个人去构成它的一个单元。只要你这个网络这堆人能够相互生成,形成一个闭合系统,这种系统就能被称为生命体。
 
埃舍尔的画作《画手》是对生产闭合特性最好的表述。以这幅画作而论,互相描摹的手构成了一个生命的闭环。

相关阅读:
埃舍尔画作中的数学秘密

图3:画手

如果我们把它抽象为一个闭合的生产网络,就如下图所示,从此处我们也可以意识到,这样的一个网络是具有自我修复特性的,即使去掉一些节点,也可以再生成出来。

图4:闭合的流动网络 



催化反应


自创生理论提出后也受到了学术界非常大的争议,其中最大一个问题是,在考虑原始生命的化学反应的时候,忽略了一个非常重要的条件——化学反应中的催化剂。这是这套理论最大的不足。

 
在个体理论研究中做了很多前沿工作的圣塔菲研究者 Stuart Kauffman 写了两本非常有想象力的书籍,一本是《宇宙为家》,另一本是《科学新领域的探索》。

图5:《宇宙为家》(左图);《科学新领域的探索》(右图)

 
在书中 Kauffman 就表达了一个观点:要构成一个能涌现出多个个体最原始的个体,就要构成一个催化闭合网络。生成生命的化学反应要被闭合圈里面其他物质所催化而出来的,而不仅仅是简单生产出来。只有加上催化剂的存在才能提高生产的速度,才会出现生命的相变。

 
图6:催化闭合网络

为了验证自催化闭合的网络是如何产生类生命组织的,Walter Fontana 提出了算法化学(AlChemy)
 
AlChemy 用一些图灵机作为化学细胞构成的分子。然后让图灵机分子两两互碰的时候,一个图灵机可以把另外一个图灵机当成数据,当成纸带上的符号来进行读写。从而生成另外一个图灵机,这就完成了所谓的化学反应。所以,这一锅图灵机就形成了所谓的图灵器,然后这些图灵机在分子汤里面碰撞,然后又会生成新的图灵机、新的分子。

经过多次反应迭代就出现了有趣的自催化闭合圈。

图7:AlChemy中形成的自催化组织示意图

 
这样一个模型不仅具备前面提到的自修复特性,也包括共生、竞争的关系。


渗流相变


直觉上,我们会觉得锅分子汤随机碰撞,产生生命组织的概率似乎很小,但是实际上,如果你把每一个化学反应看成是一个链边,然后每个分子看成是一个节点,从复杂网络里面渗流相变特性得知,一个自闭合组织的产生是存在临界相变的现象的。当化学反应足够复杂、足够多时,产生一个自我闭合圈是一个大概率事件,这就使得生命的起源,在某种程度上得到了解释。
 
图8:临界相变示意图


对生命定义的延伸


Kauffman 在《科学探索》中对生命的定义做了进一步的延伸。他认为真正的生命个体不仅仅要满足一个自催化闭合,还有一个非常必要的条件就是一定要能够包含至少一个卡诺循环。汽车发动机的四个冲程,其实就是卡诺循环。首先,物质要获取能量,同时这个能力获得完以后能做功,而且做完功以后就像马达一样恢复原状,同时进一步吸收能量再一次做功,因此构成了一个闭合的一个时间上的闭合圈。所以这个自催化闭环是一个空间上的闭合圈,卡诺循环是一个时间上的闭合圈。因此只有把时空上的闭合圈组合在一起才是一个真正的自主体。
 


从个体信息论到整合信息论


回过头去看我们研究过的模型,可以清晰地看到一个脉络:最早的图灵机模型是自上而下的对这个主体进行建模的方式,也就是说不涉及内部组成是怎么长出来的,只分析行为。由此建立的一种图灵机模型是第一代的主体模型。
 
第二代模型一个鲜明特点是不研究个体的行为。而关注它的构成,去分析一个自下而上长出来的一个模糊的组织,连边界都可能不是很清晰的组织。
 
第三代是一种对最原始生命模式的回归,借助个体信息论这样的工具,描述那些难以刻画边界、定义不清楚的生命。
 
David Krakauer 最大的贡献是他找到一种描述的手段,描绘了生命主体和环境中间的互动,这是一个时刻按照时间去演化的过程。

图9:生命主体与环境演化示意图
 
相关阅读:
生命是什么?圣塔菲研究所提出“个体信息理论”,重新定义个体生命 

无论二者间的互动多么复杂,总是可以把它抽象成一个描述不确定性的随机过程。其中就可以用互信息来刻画主体性——也就是互相联系的紧密程度。对于一个组织来说它的个体性就体现在让这一时刻的自己和下一时刻的自己紧密相关——互信息最大化。

相关阅读:
意识谜题揭开前夜:是源于信息处理过程?还是神经网络内在属性?

以细胞代谢为例,虽然人体内部细胞诞生衰老的现象在时刻发生,但”我“在前后两个时刻是紧密相关的,因此就可以说“我”是个体、具备个体性。David Krakauer 最大的贡献就在于,如果我们能够找到一种划分,我们就可以把第二代的生命主体模型划归为第一代的生命主体模型。


涌现的层级


我们经常看到的生命体实际上具备非常强大层级的结构,它是一层一层地不断去生成、不断涌现。在空间上:这种涌现从单细胞、多细胞,多细胞到器官,器官再到组织,接下来人体甚至社会。每一个复杂的结构都是一层一层涌现出来的。
 
图10:生命层级结构示意图
 
同时,还存在着一个虚拟的层级,比如我们的大脑就“内嵌”了整个世界,整个世界都在我们的意识中有一个映射。这个层级性非常有趣,它是两个层级展开,而且这两个层级密切相关。很多研究发现,如果要承载更大空间尺度上的层级,就必须在虚拟的层级、内在的层级足够的深。这就是为什么《人类简史》作者赫拉利所说:人类之所以有庞大的数百万人的组织,就是因为我们头脑具有虚构的能力,这说明了这两个层级是密切相关的。
 
在虚拟层级、复杂性科学领域,冯·诺伊曼其实做出了巨大的贡献。在他的书《Theory of Self-Reproducing Automata》中就提到自复制的概念。
 
图11:书籍《Theory of Self-Reproducing Automata
 
相关阅读:
冯·诺依曼的遗产:寻找人工生命的理论根源
冯·诺依曼:探寻计算的“原力”
神经网络与图灵机的复杂度博弈
人工智能如何掷骰子——三种概率理论
大数之道——人脑与电脑的对比
复杂度阈值与概率论中“漏洞”
自指机器的奥秘

我们可以看到人造的机器和真实生命存在着一个鲜明的差异,这个差异就是说真实的生命它又可以自复制,存在着演化的时间箭头。
 
但是人造的系统、机器非常容易出错。所有的复杂系统存在一个所谓复杂度的阈值,就像我们人造的机器一样,你不停运行它就会自然而然受到热力学第二定律制约而衰败。这就是,我们汽车为什么长时间不维修就会出现问题,各种毛病都出来了的原因。
 
但是生命系统一旦超过这个复杂度的阈值,你就会发现生命就会不断抵抗熵增,抵抗这个衰败,而演变得更加高等,更加复杂,这是冯·诺伊曼研究自复制的最原始的出发点。实际上,也就是说自复制这个问题是跟熵增这个深刻的问题是密切相关的。
 
我们可以说复杂性存在着一个分水岭,一个阈值。超过该阈值,系统便可以不断进化下去,达不到则会衰败。这个阈值就是自复制的能力。
 
为什么说自复制可以跨越这个阈值呢?因为所有单个个体的生命都死亡,生命体自复制就是为了让它进一步延伸。我们可以说,生物体里面内部的 DNA,这一段信息其实就是对整个细胞的一个编码,一个压缩影射。在内部的世界里,必须自己包含自己的全部信息。有了生命的全部信息,生命自己就可以实现自复制。在种群上,生命体超越了个体的年龄,从而抵抗热力学第二定律给它的熵增。
 
图12:自复制
 
同时在生命体的信息自复制的时候,热力学干扰也时刻存在,这样的干扰就类似于基因突变,能够创造崭新的生命。形成一个新的代码以后,这个新代码又会在细胞里面完成自复制。这样可以反过来把热力学的干扰变成一个动力来源,冯·诺伊曼的在他的书中都提到了上述内容。
 

图13:《Theory of Self-Reproducing Automata》书中的插图


谁来给生命下定义?


我们回顾生命主体的理论,大概是按照演进历史的角度描述,但是主体和个体问题还远远没有真正被我们回答,科学家还有很多很多路要走,这里面确实也藏着非常深刻的一些关于生命本质的问题。从一个涌现的角度解释生命也许是一个好的尝试。因此,我们不可能从外在观察者的角度去划分生命的边界,谁去定义生命,可能只有生命自己。


课程录播已上线


https://campus.swarma.org/course/1529



讲者:张江

整理:Leo、刘华林

编辑:张爽



推荐阅读


生命是什么?圣塔菲研究所提出“个体信息理论”,重新定义个体生命

无标度网络模型开山之作:随机网络中标度的涌现

生命的算法复杂度:为什么进化总能找到一条简单路径?

复杂网络上的爆发现象综述:相变、爆发、生命起源有何共同之处

加入集智,一起复杂!





集智俱乐部QQ群|877391004

商务合作及投稿转载|swarma@swarma.org

◆ ◆ 

搜索公众号:集智俱乐部


加入“没有围墙的研究所”

让苹果砸得更猛烈些吧!



👇点击“阅读原文”,了解更多录播内容