量化集体行为特刊:信息论为量化集体性提供形式化框架
导语
集体行为作为复杂系统的典型特征,存在大量有关同步、自组织的定量研究。然而,多数研究仅止步于以单一的视角或方法孤立量化集体性的某一方面,却少有人涉足集体行为研究的中心,即集体性是什么,如何量化不同系统间集体性的差异。2021年11月,Springer 旗下理论生物学期刊 Theory in Biosciences 出版了一期“量化集体行为”特刊,收录了1篇量化集体性的综述以及6篇有关集体行为机制的研究。综述参考对个体性的量化研究,提出集体性的定义本质上是关于如何从系统组分中分离宏观变量的问题。以下为综述全文翻译以及6篇研究的摘要翻译。
研究领域:集体行为,信息论,因果涌现,粗粒化,标度律
Theory in Biosciences | 来源
郭瑞东 | 译者
张澳 | 审校
邓一雪 | 编辑
特刊题目:
Quantifying Collectivity
特刊链接:
https://link.springer.com/journal/12064/volumes-and-issues/140-4
目录
综述
量化集体行为
摘要
1. 非生命集体和生命集体中统一的信息架构
2.生命历史中的集体性节奏与模式
3.度量集体行为: 一种生态学方法
4.寻找集体系统中的结构
5.量化网络结构对集体决策速度和准确性的影响
量化集体行为
量化集体行为
论文题目:Introduction to the special issue: quantifying collectivity
作者:Bryan C. Daniels,Manfred D. Laubichler,Jessica C. Flack
发表时间:2021年11月17日
论文地址:https://link.springer.com/journal/12064/volumes-and-issues/140-4
生物系统多种多样,从真核细胞这样紧密结合、高度集成的多体系统,到分散的微生物生物膜,再到包含数百个灵长类动物的小型群体,一直到庞大的复杂社会(如昆虫和人类社会)及生态系统。如此大的跨度表明,系统间的集体程度以及组成集体的方式均存在差异。
然而,我们对很多问题都知之甚少,关于集体行为的多样性,如何量化多样性,或者多样性对系统鲁棒性、进化或自适应的影响。其中部分原因(具有讽刺意味的)是,我们倾向于孤立地研究集体的各个方面。利用动力系统的工具,研究人员探讨萤火虫是如何同步闪光的 (如 Ramírez-Ávila et al. 2019)。利用统计物理学的工具,研究人员探索了蝗虫如何合作移动(如 Buhl et al. 2006),鸟群如何选择飞行轨迹(如 Bialek et al. 2012),以及噪音在诱导集体从有序状态到无序状态转变中的作用(如 Jhawar et al. 2020)。
分科的研究传统,以及对易处理数学方法的偏好,使得研究集体行为的科研团体集体忽视微观复杂性越来越多的证据:举个相对简单的例子,雄性萤火虫在交配季节同步闪烁时,也参与集体运动,但对其同步行为的研究通常是独立于集体运动展开的。在最近的一篇论文中(O’Keeffe et al. 2017),O’Keeffe等人指出这一点,用来改进他们提出的混合 swarmalator 模型——对于研究同步和集体行为的结合,以及不同形式的集体行为如何相互影响,这是一个进步。
虽然集体行为的相关研究在这些问题上有所改进,如 Peleg 和合作者(如 Sarfati et al. 2021)关于萤火虫群落自组织和同步的工作,以及 Cavagna 和合作者(Cavagna et al. 2017)关于蚊群中动力学标度的工作 ,但此类研究仍不足。为理解集体行为对系统表现、鲁棒性和进化的影响,我们需要更好地理解集体性意味着什么。为此,我们需要形式化集体性,以量化集体性及其相应的概念结构。
集体性的形式化会是怎样的呢?也许最接近形式化的尝试,是最大熵的应用和对个体性(individuality)的研究。在使用层次最大熵模型研究集体行为的场景下,一个目标是确定最能解释宏观可观测量的相互作用的主导阶数(例如,成对相互作用、高阶相互作用)(如 Mora et al. 2010)。问出“哪一阶相互作用占主导?”这个问题,就是认识到系统的可分解程度可能存在差异。
在对个体性的研究中,Krakauer 等人在最近的工作(Krakauer et al. 2020)中创建了对个体分类的第一性原理,称为个体信息论(Information Theory of Individuality,ITI)。该理论将个体形式化为时间不确定性的减少,将其重构为动力学过程,因此该理论可能不会先验地排除比如社会系统和黏菌,尽管它们在空间上并未聚合,也没有以合适的方式复制,但在该理论下仍可具有个体性。根据信息“储存”在环境、个体的过去经验或上述两者的互动中,个体信息论包含不同程度和类型的个体性。个体信息论的发展暗含了概念的转向,从对稳定(一般是静态)实体形而上的追求,转向动态且聚焦于过程的概念,过程本身就定义了相关的实体和分析对象。
个体性的例子也说明,一个被认为具有许多维度的概念(例如,复制、有界性、利益或相关适应度的组分一致性等)实际上可以被提炼成一个相对简单的基于第一性原理的形式定义。然而,个体性作为生物学和哲学文献以及个体信息论中的概念,一直存在争议。正是受这种杂乱的、很大程度上定性的争论影响,个体信息论可被理解为对争论的一种回应——一种通过形式化和精确化来取得进展的愿望。对集体行为的研究沿着非常不同的方向进行。它从一开始就是定量的,但是正如上面所讨论的,集体行为研究聚焦于使用定量方法来独立研究集体性的不同方面,例如同步或集群。集体性的概念——它是什么以及它在不同系统之间如何变化——从来都不是真正的关注焦点。
但无论是个体性还是集体性研究,绝大多数研究都始于对相关实体的预设概念——如一群鱼、一群灵长类动物、一群鸟或一个细胞、一个有机体、一个群体等,然后开始孤立地分析这些实体的属性(Krakauer et al. 2020)。通过聚焦于对个体功能、动力学和关系属性严格的形式化描述,我们反转了问题的顺序。这使我们不仅能够以一种更加综合的方式分析集体性,并使我们能够识别出不那么显而易见的集体行为类别。
在本文中,我们提出,集体性本质上是关于如何从系统组分中分离宏观尺度,使得极端情况下,甚至不依赖于微观尺度,也能够预测宏观尺度。我们指出这种说法需要满足三个条件(Krakauer and Flack 2010; Krakauer et al. 2011)。首先证明宏观变量是根本的而不是名义上的变量,也就是说它们源于系统的微观行为。其次,需要给出一系列宏观变量间类似定律关系的统计证据,比如哺乳动物代谢率与质量间近乎线性的标度律(如 West et al. 2002)。最后,还需要测量这些关系对微观扰动的敏感程度。我们指出,条件2和条件3共同确定了宏观尺度从微观尺度中被分离出的程度,也就是集体性的程度。
我们进一步提出,这种关系理论上可以通过信息论形式化(形式化的具体方式则留待未来研究)。这个定义的一个优点是,它以一种可比较的方式将集体性从个体性中分离开:集体性捕捉了微观和宏观之间的信息流,即信道强度(临界行为中的案例见Daniels et al. 2017);而个体性通过个体信息论被形式化为时间不确定性减少(Krakauer et al. 2020),量化了系统过去和未来宏观状态间的信息流,即信道强度。
随着神经科学(Krakauer et al. 2017)和集体行为(Bain and Bartolo 2019)等领域能够获得更优质的微观数据,证明我们需要一个形式化框架,在各个系统的基础上量化微观行为对宏观行为的重要性,并能够解释主导动力学的信道变化, 关于“还要走向多微观(how far down to go)”的广泛争论重新燃起。
最近 Muscarella 和 O’Dwyer(2020)的研究间接指出了形式化的重要意义。他们基于一个实证的、粗粒化的物种细胞新陈代谢模型,惊人地发现较弱的竞争者由于低一级新陈代谢网络的特性,得以在种群中维持。换句话说,通常被假定在物种-物种相互作用中不会发挥影响的微观尺度互动,实际上是与宏观相互作用相关的。但是为了“看到”这种效应,必须对微观尺度适当粗粒化。这个例子说明,更多关于系统集体性程度的仔细思考,会直接影响模型和理论的建立。
除了形式化信道切换并对其进行检测,还应该了解导致宏观尺度分离的原因。宏观尺度从微观尺度中分离出的程度,似乎会受到网络结构、各要素间相互作用的可分解程度以及在系统中整合信息以产生集体输出的算法复杂性这三个因素的影响。
我们认为,要取得进展,需要在三个方面开展工作。本期特刊的论文大体上属于第三方面。
1.恰当描述宏观尺度行为,包括识别关键的集体行为,如同步和集群,以及描述它们如何相互作用。这组问题涉及到集体现象。
2.发展考虑到上述条件2、3的第一性原理形式化,以量化宏观尺度集体性的程度。这类研究有助于形式化集体性理论及度量问题。
3.研究网络结构、信息聚合算法和介观尺度可分解性等系统特性对提取宏观尺度集体性的影响程度。这当然充满了技术问题,包括如何量化算法的复杂性和可分解性。关于可分解性,存在大量基于信息论的部分信息分解(partial information decomposition)对可分解性和协作的度量,以及对统计和理解差异的度量(Tekin 2017) 。这一系列的问题是关于集体行为的机制。
总之,在这些问题上的进展将有助于形成一个恰当的集体行为理论。
特刊文献
(参考文献可上下滑动查看)
以下为Theory in Biosciences当期另外6篇论文的摘要:
1. 跨越非生命集体和生命集体的信息架构
论文题目:Informational architecture across non-living and living collectives
作者:Hyunju Kim,Gabriele Valentini,Jake Hanson,Sara Imari Walker
发表时间:2021年2月2日
论文链接:https://link.springer.com/article/10.1007/s12064-020-00331-5
集体行为被公认为生命系统和智能系统的标志特征。然而,已有很多例子说明简单的物理系统也可展示出集体行为,简单物理模型也因此常被用于解释生命系统的集体行为。要理解在生命系统中出现的集体行为,就必须确定非生命系统和生命系统所展示的集体行为是否存在根本差异,以及在解释生物现象时,通过简单物理模型来建立直觉所具有的局限性。在这里,我们基于系统的信息架构,提出了一个比较非生命的和生命集体行为的连续框架:即具体比较系统在各自由度下存储和处理信息的差异。本文从信息论的角度回顾了集体现象的各种实例,并基于信息架构,指出了对生命集体行为进行量化的未来研究方向。
非生命集体和生命集体的信息架构
2. 生命历史中集体性的节奏与模式
论文题目:Tempos and modes of collectivity in the history of life
作者:Douglas H. Erwin
发表时间:2019年9月16日
论文链接:https://link.springer.com/article/10.1007/s12064-019-00303-4
生命在发展历史上,对信息的集体整合和处理水平不断提升,一方面包括形成集合体,集合体中的实体可能有非常不同的特性,且能够共同对环境变量(从微生物群落中广泛变化的新陈代谢到珊瑚礁上物种的生态多样性)粗粒化;另一方面还包括聚合相似的实体(例如生物体中的细胞或社会群体)。这种提升与生命进化史上的重大转变有关,包括生命起源,微生物以及叠层石(stromatolites)等微生物群落、多细胞生物、群居昆虫中泛基因组的产生。该研究概述了集体信息处理在生命历史中的主要形式,其系统发育分布和聚合程度,以及信息整合、处理的新形式对进化节奏的影响。
3. 度量集体行为:一种生态学方法
论文题目:Measuring collective behavior: an ecological approach
作者:Deborah M. Gordon
发表时间:2019年9月26日
论文链接:https://link.springer.com/article/10.1007/s12064-019-00302-5
集体行为在自然界中无处不在。从大脑到蚁群等许多系统都没有中央控制,集体行为是通过个体(如神经元或蚂蚁)间的相互作用来调节。相互作用创造了反馈,产生了我们观察到的行为:如大脑思考和记忆、蚁群收集食物或迁移巢穴、鸟群转向、人类社会组织形式的发展。但是产生上述行为的互动过程,和行为本身一样多样。正如趋同演化产生了基于不同生理过程但功能相似的器官(如眼睛),不同的互动过程也产生了相似的集体行为。生态学的视角可以帮助我们理解集体行为的动力学及其运作方式。
4. 寻找集体系统中的结构
论文题目:Searching for structure in collective systems
作者:Colin R. Twomey,Andrew T. Hartnett,Matthew M. G. Sosna,Pawel Romanczuk
发表时间:2020年3月23日
论文链接:https://link.springer.com/article/10.1007/s12064-020-00311-9
从鱼群、鸟群到生物膜和神经网络,自然界的集体系统是由许多相互影响的个体组成的,这些个体通过局部相互作用产生大规模的协作行为。虽然协作对于集体行动的意义至关重要,但这些系统中大规模的协作方式是临时性的,也是随系统改变的。由于缺乏共同的量化尺度,广泛的跨系统比较难以进行。本文在多变量依赖(multivariate dependence)的信息论测度的基础上,提出了一种与系统特征无关的对协作程度的度量,并表明它甚至可以为已被深入研究的经典集体系统提供一个新的视角。此外,我们通过该度量推导出一种新的方法,以寻找系统中协作程度最高的组件,并证明该度量在实际中如何可用于揭示系统内部的组织结构。
5. 量化网络结构对集体决策速度和准确性的影响
论文题目:Quantifying the impact of network structure on speed and accuracy in collective decision-making
作者:Bryan C. Daniels,Pawel Romanczuk
发表时间:2021年2月26日
论文链接:https://link.springer.com/article/10.1007/s12064-020-00335-1
从神经元到蚂蚁再到鱼,二元决策是最简单的集体计算形式之一。该过程积累个体收集到的关于不确定环境的信息,以在集体尺度上引导行为。我们研究网络的二元决策动力学对小信噪比输入的响应,寻找控制任务表现的集体性的定量度量。我们发现,决策的准确性与集体动力学的速度直接相关,而集体动力学的速度又由三个因素控制:网络邻接矩阵的最大特征值,最大特征值对应的特征向量的参与率(participation ratio),以及与相应对称破缺分岔点的距离。对于该分岔点附近最大可得时间尺度的新近似,允许我们仅根据其光谱特性,预测决策表现随大型网络的缩放。具体而言,我们探讨了“富人俱乐部”拓扑的层次同配结构导致的局部化(localization)的影响。这使我们能够深入了解在真实网络中执行集体计算的高阶结构所涉及的权衡。
6. 在科学网络的边缘地带,创新更可能出现
论文题目:Innovations are disproportionately likely in the periphery of a scientific network
作者:Deryc T. Painter,Bryan C. Daniels,Manfred D. Laubichler
发表时间:2021年11月12日
论文链接:https://link.springer.com/article/10.1007/s12064-021-00359-1
对科学创新起源的常见历史叙事往往集中在少数有影响力的作者身上,这种方法严谨,但范围有限。在这里,我们开发了一个框架,通过自动分析包含超过6000份文献的文献库来严格识别整个科学领域的创新,该文献库包括进化医学领域发表的每一篇论文。这种全面的方法允许我们探索创新的统计属性,探寻领域现存概念框架中最可能产生创新的区域。首先,我们发展了一种基于新颖性和持久性的创新度量,量化了新颖语言和思想的集体接受程度。其次,我们通过文献耦合网络研究该领域的概念景观。我们发现,创新更可能出现于文献耦合网络的边缘地带。这表明,没有与成熟研究路线建立联系带来的相对自由,有利于创造新颖且持久的变化。通过这种方式,科学领域涌现的集体计算也可能会展现出鲁棒性与适应性的权衡,与其它生物社会复杂系统中的情况类似。
自生成结构读书会报名中
推荐阅读
-
集体行为怎样促进生态系统的稳定性与多样性? -
量化因果涌现表明:宏观可以战胜微观 -
因果涌现:数学理论揭示整体怎样大于部分之和 -
临界的鸟群与复杂系统——2021年诺奖得主Giorgio Parisi的集体行为研究 -
Science Advances:萤火虫的同步依赖局部互动 -
《张江·复杂科学前沿27讲》完整上线! -
成为集智VIP,解锁全站课程/读书会 -
加入集智,一起复杂!
点击“阅读原文”,报名读书会