PNAS：如何定量描述复杂度？新方法来了

2020-12-06 5,226 0

导语

系统的复杂度，虽然有很多定义方式，但作为复杂性科学的基本问题，远远没有获得确定的回答。重整化群可以通过数学变化，统一地考察不同尺度的物理系统。近日发表在PNAS的一篇论文，基于重整化群，提出了在多层级复杂系统中定量描述复杂度的新方法。

郭瑞东 | 作者

邓一雪 | 编辑

论文题目：

Multiscale structural complexity of natural patterns

论文地址：

https://www.pnas.org/content/117/48/30241

1. 已有的复杂度定义的方法

最广为人知的定义复杂度的方式，称为Kolmogorov复杂度，该方法使用能够对某一信息编码的程序的最小长度，来代表一段信息的复杂度。例如101010相比110001，前者由于存在规律，能够用更短的程序描述，其复杂度更低。

如果不同尺度的子系统间相似度较低，那么系统的复杂性也越高。然而，我们对复杂度的直觉，告诉我们需要该定义同时反映系统中有多少组件及连接，以及系统中的这些组件及连接是否可见。基于系统自相似来定义复杂度的方式，只反映了后者，没有考虑那些系统中隐藏的连接，不完全符合我们对复杂度的直观映像。

在真实环境，例如生物系统、社会系统中，往往同时存在多个层级，不同层级的结构，以及受到的约束存在显著区别。考虑到复杂系统往往是层级化的，对系统复杂度的定义就必须考虑到不同层级，而不能主观地规定某一层级的特征是本质的。复杂科学需要提出一个明确定义，能够整合不同层级信息、且具有鲁棒性的复杂度定义。对于那些完全有序或完全无序的系统，该定义得出的复杂度都应该极低。

这篇PNAS论文，提出了基于重整化群的复杂度定义方法。

2. 基于重整化群的复杂度定义

例如拍照的时候zoom in，发现看到的现象有些接近，将小尺度的现象，放到大尺度去分析。由于系统具有自相似性，通过对比两种模式下分析的差异，可以用大尺度的分析，来作为对小尺度现象的建模。这可以看成是重整化群的通俗理解。

图1. 基于重整化群计算图片复杂度的方式

如何计算上面这幅图片的复杂度？重整化群的方法，是将该图分为16份，再将图中的某一份放大之后分为16份，将其中像素平均后，得出该子图的不同区域像素值。将原图的16个子图依次排列，得到A，再将子图分割排列得出图B，计算图A和图B之间的差异，得出图O。将所有如此分割得出的图O的复杂度加和，就完成了一个层级上的迭代，将不同层级的结果加和，即得出了原图的复杂度。

图2. 自然界和人工产生的图像对应的复杂度

上图中从左到右，该方法计算出的复杂度依次升高，这展示了使用该方法，可以衡量图像的复杂度，符合人类直觉。具体对的计算方法和公式，请参考原文。

3. 通过复杂度判断相变

在统计物理中，Ising 模型描述了磁性原子之间由于相互作用，而形成的晶格。由于该模型中，参数在某个阈值左右的细微变化，就能引起系统整体的显著变化，这被称为相变。发生相变前后，系统的复杂度会发生显著变化，这可以用来验证新提出的复杂性度量方法。

图3. 二维Ising模型的模拟数据下，不同温度和复杂度的对应关系

上图中，横轴温度可以看成是系统具有的能量，能量越高，系统越无序。红色和蓝色的线代表计算复杂度时，迭代计算的次数不同，即对复杂度的计算方法有所不同。不论那种计算方法，当相变发生时，复杂度都会呈现显著变化。而蓝线对应的算法，当系统的无序程度进一步提升时，复杂度下降，这符合一个完全无序的系统没有处在混沌边缘系统复杂的直觉。而红线对应的算法，由于迭代次数过少，导致其不会考虑更小尺度的差异，相变点之后，复杂度就不再变化。

而在更高维度，以及真实的微粒扩散过程中，该方法都能够反映出相变现象。如下图所示

图4. 三维系统中，基于重整化群的复杂度算法得出的复杂度和系统温度的关系

图5. 微粒扩散过程中，随时间变化的系统复杂度

4. 复杂度在各个领域的应用

以上实验说明，在固态物理中，可以使用该方法，根据实验得出的图像来发现如法通过实验找到的相变现象。

此外，在机器学习中，系统的复杂度可以成为额外的信息来源，例如在应对对抗性攻击，即通过改变少数像素点，就改变对应分类标签。例如本文作者假设上述改变会增加图片局部的复杂度，从而改变原图中各个子图的复杂度分布，据此识别对抗性的训练数据集。

而在生物领域，复杂度这一概念的应用虽然鲜有研究，但通过计算处在进化树上不同物种的基因序列的复杂度，可以研究进化过程中的相变点，即生物集中爆发或产生显著变化的过程。不同层级系统间的竞争和制约，被认为是生物体复杂性的来源之一。而这也反映了时间及空间层面上的不同系统存在的不相似性，在复杂性科学的核心位置。

测量复杂度还对因果发现有启发。之前的研究中，根据对不同信号压缩的难度差异，判断信号间的因果方向，更难压缩的信号是因[1]。据此我们可以推测，考虑不同系统间的复杂度随时间变化的曲线的先后，有可能可以判断出两个系统间的因果箭头。这有赖进一步的研究。

参考资料

1. SY, Pranay, and Nithin Nagaraj. “Causal Discovery using Compression-Complexity Measures.” arXiv preprint arXiv:2010.09336 (2020）

复杂科学最新论文

集智斑图顶刊论文速递栏目上线以来，持续收录来自Nature、Science等顶刊的最新论文，追踪复杂系统、网络科学、计算社会科学等领域的前沿进展。现在正式推出订阅功能，每周通过微信服务号「集智斑图」推送论文信息。扫描下方二维码即可一键订阅：

推荐阅读

点击“阅读原文”，追踪复杂科学顶刊论文

PNAS：如何定量描述复杂度？新方法来了

同步：为什么我们都爱整齐划一？为什么我们都会步调一致？

一周值得学：集智学园新课视频速览 | 11.30-12.06

发表评论点击这里取消回复。

统计物理基础

重整化群分析在非线性物理中的应用

复杂系统的涌现动力学

Koopman分析在非线性动力学中的应用

重磅系列课程：控制科学前沿理论与方法

复杂系统入门与实战（Python）

热门浏览

最新文章

一盏灯，为你而亮丨集智招全职or兼职运营助理

系统科学：超越相对论与量子力学的科学革命

推荐｜苇草智酷·智盟酷创计划

Nature子刊：非线性动力学最新论文合集

【会议通知】第二十一届中国科技政策与管理学术年会暨研究会理事会会议（第四轮）

PNAS：如何定量描述复杂度？新方法来了

微信扫一扫,分享到朋友圈

同步：为什么我们都爱整齐划一？为什么我们都会步调一致？

一周值得学：集智学园新课视频速览 | 11.30-12.06

猜你喜欢

一盏灯，为你而亮丨集智招全职or兼职运营助理

系统科学：超越相对论与量子力学的科学革命

推荐｜苇草智酷·智盟酷创计划

Nature子刊：非线性动力学最新论文合集

【会议通知】第二十一届中国科技政策与管理学术年会暨研究会理事会会议（第四轮）

清华大学崔鹏教授首创基于因果推理的大模型——极数（LimiX）大模型丨集智百科

发表评论 点击这里取消回复。

统计物理基础

重整化群分析在非线性物理中的应用

复杂系统的涌现动力学

Koopman分析在非线性动力学中的应用

重磅系列课程：控制科学前沿理论与方法

复杂系统入门与实战（Python）

热门浏览

最新文章

一盏灯，为你而亮丨集智招全职or兼职运营助理

系统科学：超越相对论与量子力学的科学革命

推荐｜苇草智酷·智盟酷创计划

Nature子刊：非线性动力学最新论文合集

【会议通知】第二十一届中国科技政策与管理学术年会暨研究会理事会会议（第四轮）

关注我们的公众号

发表评论点击这里取消回复。