复杂物理学是可能的吗?|《规模法则》新书试读


张江:北京师范大学系统科学学院教授,集智俱乐部、集智学园、集智科学研究中心创始人,曾任腾讯研究院、华为战略研究院等特聘顾问。主要研究领域包括复杂系统分析与建模、规模理论、机器学习等。
新书试读:复杂物理学是可能的吗?
所谓大道至简,复杂现象背后往往隐藏着简单的规律。这就是本书的立足点。我们的研究对象是各类复杂系统,从生命到生态,从互联网社区到城市,这些系统都有数量庞大的相互作用单元,而且单元之间存在错综复杂的相互作用关系,对每个单元的微小扰动都有可能导致系统整体的巨大波动。另外,这些研究对象隶属于不同学科。我们怎么从这些纷繁复杂的对象中找到规律呢?
答案就在于忽略信息。我们必须大刀阔斧地忽略不相关的信息,才有可能让真正有价值的信息凸显。人们关心复杂系统,因为复杂系统就在我们身边。人们提出了大量问题希望科学家们回答,例如,如何预测股价的涨跌?如何给经济发展诊脉?面对复杂多变的世界,个体如何做出正确的决策?如何让自己的公众号吸引更多粉丝?然而,这些问题对于我们要寻求的普适理论来说都是噪声。尽管终极的统一理论一定要直面这些大家都关心的问题,但在现阶段不应该考虑这些问题。如果我们过于关注它们,尽管看起来是在解决实际问题,但其实会忽略更重要的信息。这就好比当年牛顿如果不去关注天体的运动,而去关注马车的运动,那么他绝不可能提出今天我们熟知的牛顿力学。因为这些看似更加常见的事物对于构建牛顿力学来说隐藏着非常多无用的噪声。
于是接下来的问题是,究竟应该关注什么样的问题,才能更好地构建复杂系统的一般科学体系呢?答案是这种问题应该同时具备两个关键特征:普遍性和重要性。普遍性是指该问题涉及的概念应该在绝大多数复杂系统中存在;重要性是指对这个问题的回答应该对复杂系统非常重要。这两种特征缺一不可。如果问题不具备普遍性,那么我们开展的研究就不是对复杂系统一般理论的研究,而是对细枝末节的讨论;如果问题不重要,那么很有可能会使得我们错失关注对象的本质。
什么样的问题兼具这两种特征呢?我们的答案是:规模与新陈代谢。
1.1 规模法则
规模就是既普适又重要的变量。然而,仅有规模这个变量还不够,我们还必须考察其他变量在规模缩放下呈现的现象和规律,这就是规模法则。于是,简洁的规律开始浮出水面。这就是贯穿整本书的幂律方程:
Y=aXb
我们偏爱这个简单的方程,因为它既能反映复杂系统背后的统一性,又能反映它们的个性。
1. 普适性
首先,这个方程适用于几乎所有复杂系统,这一点就说明了它的普适性。几乎所有复杂系统都存在规模缩放对称性。对称性是数学和物理学中的重要概念,它是变化与不变的对立统一体。在规模缩放对称性中对应的变化就是扩缩变换,而对应的不变性就可能是不同大小复杂系统背后的抽象模型,例如网络、流动等。因此,大象与老鼠遵循同样的克莱伯定律,实际上意味着大象是老鼠的放大版本。
其次,规模法则的幂指数通常可以反映不同研究对象的共性。比如,对于所有的城市来说,GDP、新申请专利数量、犯罪数量等规模法则的幂指数都接近1.15,这个1.15就是一个普适的量。这种普适性说明GDP、新申请专利数量、犯罪数量等都是同类型的变量——它们都与人和人之间的社会交互密切相关。再比如,所有生物体,无论是新陈代谢率、寿命长短、心跳频率还是呼吸频率,它们与体重之间的规模法则幂指数都是1/4的倍数。这个普适的数字1/4恰恰说明生物体内部存在一个额外的第四维度。
2. 多样性
如果我们仅仅关注普适性,就很容易犯将复杂问题简单化的还原论错误。所以,我们还需要关注普适性背后的多样性,它往往可以揭示不同系统在不同场合的个性。
首先,虽然本书讨论的所有复杂系统都满足规模法则,但是这些规模法则在不同系统中的幂指数非常不同。例如,生物体的幂指数大多小于1,而互联网社区、城市中的幂指数大多大于1,企业、国家的幂指数也大多小于1。
其次,同一个系统中不同的变量会具有不同的幂指数。例如,在城市中,我们可以将各个宏观变量按照幂指数大小分为三类:大于1的与社会交互相关的变量,小于1的与基础设施相关的变量,以及近似等于1的与生活起居相关的变量。在互联网社区中,多样性和人类活动这两种变量的幂指数一个大于1,一个小于1,它们体现出了完全不同的特性。我们比较了美中两国上市企业的债务规模法则的幂指数,一个近似等于1,一个大于1,这直接导致了二者的生长是否会遇到奇点。我们还可以用不同年龄分组的企业的各类指标幂指数的差异来揭示企业老化现象。这些幂指数的多样性反映了不同系统在不同方面的特点。
总之,面对各种复杂系统,规模恰恰是我们最应该关注的,同时也是最简单的变量。这一变量决定了复杂系统的其他宏观变量,这就是规模法则。规模法则看似简单,却可以揭示不同系统的共性和差异性。这就像是同一个主旋律下的不同变奏,只有这样,理论才能既优美又灵活。
然而,仅有规模法则还不行,因为它过于笼统了。能够描述复杂系统宏观特性的变量Y如此众多,几乎每一个都与X具有规模法则。因此,我们必须在诸多Y中找到最重要的一个。这就是新陈代谢率。
1.2 新陈代谢
新陈代谢是所有复杂系统的普遍特征,同时它极其重要,因为它直接把握着系统生长、衰老、死亡的命脉。生命需要呼吸、进食以从外界摄入能量和营养,并将产生的废物排出体外;企业会通过吸收资金流维持生存;城市需要从外界摄取能量和物质以支撑所有的人类活动,并且还会以前所未有的速度排放大量废热和二氧化碳;就连互联网社区也可以理解为新陈代谢系统,它们依靠社区用户的注意力流生存,并努力保持社区中的内容不断更新。
这些复杂系统中的广义新陈代谢主要有两种功能,一种是吐故纳新,一种是新老更替。吐故纳新主要是指系统和环境之间的能量、物质和信息的交换,新老更替则体现为系统中每一个单元的更新。
首先,我们来看吐故纳新。任何系统要想维持有序,就不得不向外界开放,这是因为开放是抵抗热力学第二定律——熵增的必要条件。对于生物体来说,能量可分为有序的能量和无序的能量。我们需要补充的是前者,它可以抵抗生物体产生的一部分熵,我们称这种能量中包含着负熵(negative entropy),即秩序(order)。可以说,新陈代谢的主要作用就是为了获取这种负熵。
更进一步,当负熵被摄入系统内部以后,会被送达到各个单元,于是便有了输运网络和流动。其实,我们可以将每个单元看作一个小的生命体,流入的营养物质或负熵,以及流出的废弃物或熵流(entropy flow)就等价于它的新陈代谢。每一个组成单元内部又可能存在更小的新陈代谢单元以及连接这些单元的输运网络。输运网络实际上是纽带,将小的新陈代谢单元连接到一起,形成一个大的新陈代谢单元。新陈代谢、输运网络、流动,这些是绝大多数复杂的开放系统所共有的。
其次,新陈代谢的另一项重要功能是新老更替。新老更替是指系统中每个组成单元的变更。每一个单元在系统内部流动的带动下被激活。这些激活的单元在运动过程中必然会产生损耗,损耗多了就会导致部分单元失效。为了弥补这种损失,复杂系统内部往往会通过一种维护机制进行修复,这就是新老更替的过程。系统整体必须在每个微观单元都瞬息万变的情况下维持长期的稳定性。这一过程也普遍存在于各种复杂系统中。
然而,如果仅仅认识到这一点,我们充其量可以构造复杂系统的描述理论而不是定量的科学。幸运的是,早在1932年,克莱伯定律的发现就为我们用定量的手段研究新陈代谢问题提供了重要基础。这一发现可以说具有划时代意义,一方面它向我们展示了生物学存在类似于开普勒定律那样的精确定量规律,另一方面它将新陈代谢率和生物体规模这两个重要的变量联系到了一起。更重要的是,围绕克莱伯定律,我们还能发现一系列重要规律,例如心跳频率、寿命长短的规模法则。
于是,本书的后续章节以克莱伯定律为起点进行展开。首先,我们介绍了能够推导出克莱伯定律起源的WBE模型,然后研究如何将克莱伯定律推广到包括河流网络、百度贴吧等更多的广义的流系统中。
广义克莱伯定律其实刻画的是复杂系统中的“流”与“存”的定量关系,二者必须相互匹配。“流”对应了新陈代谢率,“存”则对应了规模。广义克莱伯定律的幂指数则刻画了流量相对于存量的变化快慢,它因情况而异。例如,在百度贴吧的例子中,我们就用广义克莱伯定律的幂指数刻画出不同贴吧的用户黏性。我们还可以利用这个幂指数来刻画流网络的去中心化程度。
对于互联网社区和城市的讨论其实也算是对克莱伯定律的推广。只不过这里的新陈代谢并没有太多流动的特征,而更多体现为人类从事的活动。与生物体和一般的流系统不同的是,在这类存在人与人之间交互的系统中,我们发现了活动或交互关系的超线性规模法则,这与生物体中的亚线性法则形成了鲜明对比。这种差异将导致两类系统的宏观动力学特性存在显著不同。那么,为什么会存在超线性和亚线性这两类不同的规模法则呢?如何统一描述生物体和人类组织这两大类复杂系统?1.4节将继续讨论。
总之,新陈代谢对于开放的复杂系统起着异常重要的作用,它既是连通系统与环境的关键因素,又是维护和更新系统内部组成的驱动力,还是决定系统生长与死亡的重要因素。
1.3 死亡与生长
生与死绝对是天底下的头等大事。所有复杂系统都有生有灭。所以,生与死的问题也同时具备普遍性和重要性。
事实上,韦斯特在建立规模理论体系的时候,就是从思考死亡这个问题入手的。生物体为什么会死亡呢?答案就在于新陈代谢过程中产生的损耗。因此,死亡与新陈代谢密切相关。个体细胞层面的新陈代谢速度越快,其损耗也会越快,整个生物体死亡的速度也会越快。这就是为什么一般体型大的生物体寿命长——每单位质量的新陈代谢率会随着生物体体重的增长而降低。
对于城市来说,这一推理过程也是类似的,但是死亡的方式与生物体截然不同。首先,城市越大,个体的生活节奏也会越快,这同样会导致磨损和消耗——“熵”的产生加快。但这里的熵与物理世界的熵略有不同,它更多体现为“社会熵”,即犯罪发生、环境污染、疾病传播等负面因素。城市越大,这些负面因素积累得越多,直到最后使城市走向奇点,即在有限的时间内产生无穷多的“社会熵”,导致城市崩溃。
然而,在这一推理过程中,我们忽视了科技的力量。理论上城市越大,人们的生活节奏越快,个体会承受更多的损耗,预期寿命越短。但实证数据统计发现,人均GDP越高,死亡率却越低,原因在于人们的生活水平提高和先进的医疗保障等。另外,科技能够重启城市的演化进程,延缓城市走向奇点的步伐。
从熵的角度来看,每一次科技革命可以理解为寻找到一种新的负熵源,从而可能让复杂系统起死回生。然而,就像空调虽然可以通过电力做功降低室温,但这是以使外部环境温度升高为代价一样,科技也是通过更快地产生熵为代价让城市起死回生。作为城市环境的整体,系统仍然保持熵增,而且熵增的速度不可避免地会越来越快。这就是最终城市可能仍然无法避免走向终极奇点和崩溃的本质原因。
从生长的角度来说,新陈代谢也起到了非常重要的作用,它是万事万物生长的直接推动力。系统将吸收的能量流/物质流/注意力流/资金流分成两份,一份用于促使系统生长,另一份用于维持系统内部单元的新老更替。正是这两项的差异导致了系统不同的生长模式。
对于生物体来说,随着发育,用于生长的能量会越来越少,以至于最后趋近于零。于是所有生物体在达到一定体型以后都会停止生长。对于城市来说,随着规模的增长,用于城市发展的财富却会越来越多,最终将会导致奇点到来。这种差异的根源就在于广义新陈代谢的规模法则不同,生物体是亚线性的,而城市是超线性的。
企业算是一种奇怪的存在,因为尽管它的新陈代谢率(净收入)满足亚线性规模法则,资金、人员的周转速度都会随着企业规模增长而下降,然而它并不总是像生物体那样会停止生长,而有可能一直生长下去。其关键因素就在于债务,它相当于通过透支未来为企业的资金池注入资金。有趣的是,债务也存在规模法则,它的幂指数直接决定了企业的发展是否存在奇点。当规模法则是超线性的时候,企业的发展就会被这个奇点所限制。
1.3 模型之美
上述讨论仅仅局限在唯象规律的层面。也就是第谷→开普勒→牛顿研究范式的第二个环节。若想从开普勒式的唯象规律进化为牛顿式的基本原理,提取概念和构建模型显然是必不可少的。例如,质点、加速度、力等是力学中的基本概念;斜面、弹簧等是基本模型。同样,规模理论也必然需要模型的助力,并由此提取基本概念。
1. 模型回顾
接下来,我们就来回顾本书讨论过的模型,并试图找到它们之间的联系。为了解释克莱伯定律的起源,本书介绍了WBE模型[6]、巴拿瓦网络模型[7]、德雷尔球等模型;为了解释互联网社区中的规模法则,我们介绍了“挖雷”模型[8]和匹配生长模型[9];为了解释城市中的一系列规模法则,我们介绍了层级化的道路网络模型和改进的匹配生长模型。虽然这些模型五花八门,但是它们都试图用最简单的机制来解释从数据中观察到的宏观行为和规律。各种模型的背后都存在一个网络,宏观规模法则可以归结为这个网络的统计特征。
这些模型可以大致分为两类:一类是基于流网络的模型,以巴拿瓦网络模型为代表;第二类是基于人与人之间交互的模型,以匹配生长模型为代表。这里我们就这两个代表性模型进行详细比较。
首先,巴拿瓦网络模型是一个特殊的流网络,它可以用来对生物体建模,并阐释广义克莱伯定律是如何起源的。这个网络嵌入在一个d维空间中,具有一个中心节点——源,其他所有节点都是汇。生物体通过新陈代谢从外界摄取的能量沿着这个输运网络从源经由各个节点流向汇。如果我们计算这个输运网络中根节点的流量与网络中所有连边上的总流量,就会发现它们满足幂指数为d/(d + 1)的广义克莱伯定律。二维的巴拿瓦网络模型如图1所示。
匹配生长模型用于对互联网社区或一般复杂网络的生长行为进行建模,并尝试阐释超线性规模法则和亚线性规模法则的起源。这个网络也是嵌入在d维空间中的,开始的时候只有一个种子节点,然后慢慢增加节点,每一时刻都会有一个新节点落入d维空间中,但只有当它与已有节点足够靠近时才能存活,并与之建立一条连边。在网络生长的过程中,如果我们计算网络的连边数和网络在d维空间中覆盖的体积,就会发现它们一个与网络节点数呈超线性关系,幂指数为(d + 2)/(d + 1),另一个与网络节点数呈亚线性关系,幂指数为d/(d + 1)。二维的匹配生长模型生成的网络如图2所示。

图1 巴拿瓦(最优)网络模型

2. 寻找共性
这两个网络具有一定的相似性。首先,它们都嵌入到了一个d维空间中;其次,它们都呈现球对称的分布模式;再次,它们的一些元素在空间中不均匀地分布,例如巴拿瓦网络模型中的流量以及匹配生长模型中的节点和连边;最后,它们的规模法则的幂指数都和空间维度有关。
事实上,这些要素的不均匀分布才是这两个模型的关键。这些异质化分布的要素在d维空间中构成了中心对称的分形场,即不均匀的分布。我们可以通过球覆盖法求解出这些分形场的分形维数[1],这些维数恰恰就是求解规模法则幂指数的关键。
比如,在巴拿瓦网络模型中,流量分布是中心密度高,外围密度低。这样,可以计算出流量场的分形维数是 d+1。再比如,针对匹配生长模型来说,特殊的匹配生长规则导致了网络节点分布和连边分布都是不均匀的。节点场的分形维数刚好是 d+1,而连边是在节点之上叠加的新一层的异质性,它的场分布比节点更不均匀,所以连边场的分形维数是 d+2。同理,在扩展的匹配生长模型中,道路网络容量和社会交互也都是在空间中分布不均匀的场,它们的分形维数决定了各自的规模法则。
可以说,以这些模型来看,无论是克莱伯定律还是城市中的超线性规模法则、亚线性规模法则,都是分形场的产物。
3. 流网络模型的统一
当然,巴拿瓦网络模型与匹配生长模型也有很大的不同。例如,巴拿瓦网络模型是对流动过程建模,而匹配生长模型中没有这种流动。但是二者被一个中间过渡模型联系了起来,这就是“挖雷”模型。该模型用于对注意力流建模,特别是独立访客数UV与页面浏览量PV之间的规模法则。它刻画了大量用户在一个互联网社区中的访问行为。我们用d维空间来构建用户的兴趣空间,用莱维飞行来对用户在兴趣空间中的随机游走行为建模。在该模型中,我们做了一个关键假设:如果一个用户访问的兴趣点刚好有其他用户发过帖子,那么该用户的“游走”时间就会延长。这一假设模拟了用户之间的间接交互行为,也很好地模拟了独立访客数增多后浏览量以更快的速度增长的现象。
仔细比较就会发现,其实“挖雷”模型和匹配生长模型都是对用户数(UV)与用户活动数(PV)之间的超线性规模法则的建模,只不过,它们采用了不同的途径。在“挖雷”模型中,我们将整个模型放置在一个流网络的框架下讨论。也就是说,我们完全可以将每个用户当作一个流动的粒子,这样大量粒子的流动就构成了进入网络的新陈代谢流,这群用户的随机游走次数刚好对应流网络中的总流量。因此“挖雷”模型与巴拿瓦网络模型有相近之处。另外,兴趣空间、交互可以促进点击等假设与匹配生长模型非常相似。因此从更本质上来说,匹配生长模型与“挖雷”模型也是一致的。
为了更清楚地看出这一点,我们考虑更一般的情景:一群用户浏览一组不同的网页。对此我们有两种建模思路。一种是按照“挖雷”模型的方式,将用户理解为粒子,这样用户的跳转次数对应用户的活动;另一种是按照匹配生长模型的方式,将用户理解为空间中不动的节点,每个节点的连边数对应用户的交互活动。这两种方式其实异曲同工,它们都利用了用户之间的交互(直接的或间接的)来解释非线性规模法则的起源。
这种认识有可能帮助我们从更统一的视角,即流网络的方式,看待生物和社会两大领域。在生物体中,流网络就是物质、能量的输运网络,流动的主体就是物质或能量。而在社会系统中,流网络是注意力流或人在不同资源、地点间的移动构成的网络,流动的主体是人,而信息、资源、知识等成为了网络节点,如图3所示。在这样的视角下,与资源交互的总量就可以理解为流网络中的流量总和,而总人口就对应了该注意力或人的流网络的流入量。因而,这就不难理解生物体的亚线性规模法则,即3/4幂律和社会交互的超线性规模法则之间的共性了,其实这两种规模法则在流网络视角下是一回事儿,不同的是我们是以流入量还是总流量作为规模变量。

由此可见,我们可以透过流网络的视角统一理解生物和互联网社区。那么,对城市和企业的探究是否也可以统一到流网络视角呢?
首先,城市也可以理解为一个超大规模的社区,因而同样可以看作以城市基础设施为节点、人流为连边的流网络。其次,城市中天然存在多种多样的流网络,包括能量输运网络、物资输运网络、交通网络等。这些流动是理解城市复杂性的关键。另外,根据前面的讨论,企业可以理解为一个由价值构成的流网络——价值链网络,因此也可以统一到流网络模型。
4. 空间、网络与流
有了流网络这一统一的模型,我们便可以从中提取出三个关键性的抽象要素:空间、网络与流。
空间是网络存在的容器或背景,网络得以按照简单规则生长。尽管很多流网络并不存在显式的背景空间,但是我们可以假设隐空间存在,例如兴趣空间。这样,只要遵循空间中的匹配生长规则,网络就可以通过简单的规则构建。
网络是流动的基本骨架。就像河道与水流的关系一样:一方面,河道决定了水流动的方向;另一方面,水流冲刷河道,从而改变其形态。二者构成了协同演化的关系。
流动则决定了复杂系统的功能与特性,包括广义克莱伯定律等。事实上,在第4章中,我们讨论了一般流网络的克莱伯定律,并把它归结为一般的流和存的关系。其中,流指流网络的入流,而存指网络上所有流动的总和。
克莱伯定律以及其他规模法则,描述的就是网络与流如何随着系统规模的缩放而变化的问题。
有了这些基本概念和统一的流网络模型,我们也许可以进一步理解复杂系统更深入的基本原理。
流网络可以看作具有新陈代谢特征的复杂系统的普适模型,它有两个特殊节点:源和汇,它们都代表了系统所在的外界环境。这样,流网络建模的就是一个开放的复杂系统(open complex system)。耗散结构(dissipative structure)理论指出,开放性恰恰是理解耗散结构能够自发抵抗熵增,走向有序的关键。
2.1 耗散结构理论的拓展
从某种程度上来说,本书以及《规模》一书介绍的规模理论可以看作对普利高津(Prigogine)的耗散结构理论的一次深远的拓展,后者是让复杂科学第一次获得诺贝尔奖认可的理论[2]。
1. 耗散结构理论简介
耗散结构是指在远离热力学平衡状态的开放系统中,能量与物质的流动形成的有序结构,它们通过与外界环境交换能量和物质来维持自身的存在与稳定。生命、社会、经济系统、互联网等开放的复杂系统都可以看作耗散结构。
水流绕过石头会形成驻波,驻波恰恰是由大量流动的水构成的耗散结构。同理,一般的耗散结构是由一个个流动的过程构成的,有流动就会有摩擦,就要消耗能量,产生熵。这也是它们被称为耗散结构的原因。这些熵会在耗散结构体内累积,最终使其变得无序。这部分由耗散结构系统内部的非平衡过程在单位时间产生的熵,称为熵产生(entropy production)。注意,熵产生是一个速率,它会随着时间推移而累积为熵。
然而,就像生命、社会、互联网等,为什么如此众多的耗散结构可以“违背”熵增?它们不仅可以维持自身的有序结构,还能进化得更加有序?
普里高津指出,系统开放的目的除了从外界获取能量与物质以外,更重要的是获取负熵流,以此抵抗系统内部的熵产生。正如著名物理学家薛定谔在那本著名的《生命是什么》里写的那样,生物体进食的主要目的其实不是获得能量,而是获得食物中蕴含的负熵。生物体既有摄取,又有排泄,伴随着物质和能量的流动,熵也在其中流动。我们将单位时间内流入系统的熵减去流出系统的熵的总量称为负熵流(negative entropy flux)。
如图2所示,普里高津认为一个系统每个时刻总的熵增等于系统内部的熵产生减去从外界获取的负熵流。当负熵流大于熵产生时,系统的总熵就有可能降低,从而导致有序结构出现。

如果我们将系统比喻作一座房子,熵比喻成垃圾,负熵流比喻成清除垃圾,那么上述熵减的条件就不难理解了——只要清理垃圾的速度快于房子中垃圾产生的速度,就可以让房子处于干净整洁的状态,即维持有序的结构。
2. 合适的开放度
因此,要想维持有序结构,系统必须开放。然而,并不是开放了就一定能获得秩序。当开放度很小时,流入系统的负熵流不足以抵抗系统内部的熵产生。那么,是不是开放度越大越好呢?答案也是否定的,这是因为开放度大了并不意味着系统获取负熵流的速度一定能提高。就像我们可以摄取食物中的负熵流,然而并不是吃得越多越好,进食过量反而会导致无法消化,从而带来额外的损伤。这就引出了一个问题:合适的开放度是多少?
答案是“一定要与系统的规模相匹配”,也就是新陈代谢率要与规模构成幂律关系,即广义克莱伯定律。所以,从耗散结构理论的角度讲,广义克莱伯定律其实回答了系统的合适的开放度问题。
我们知道系统新陈代谢是为了开放自身,从而从外界持续不断地获得能量、物质流。我们假设现实中已存在的各类复杂系统都具有一定的合理性,那么,它们的新陈代谢率就对应了合适开放度的大小。于是广义克莱伯定律告诉了我们合适的开放度应该如何计算。
从这个意义上说,规模理论是耗散结构理论的一种扩展,它从实证的角度出发,揭示了真实的开放复杂系统是如何选择合适的开放度的——一定要与自身的规模相匹配。
3. 从熵的角度看老化与死亡
那么,是不是复杂系统只要始终保持合适的开放度,就能够高枕无忧了呢?答案又是否定的。这是因为任何复杂系统都会老化和死亡。
从熵的角度看,老化和死亡显然是熵增的结果。然而,当系统的开放度始终维持在满足克莱伯定律的水平,按理说它摄入的负熵流应该足以抵抗系统内部的熵产生,为什么总体的效果反而是熵增和死亡呢?
答案只能是,在不同的生长阶段,负熵流与熵产生的相对大小不一样。以生物体为例,有可能在生长阶段,负熵流大于熵产生,所以它可以变得越来越有序和成熟;而当生物体发育成熟,熵产生大于负熵流,这就会导致生物体的老化和死亡。
那么,负熵流和熵产生在整个生物体的不同发育阶段到底是如何变化的呢?由于目前的技术手段尚难以对具体的复杂系统测出其负熵流和熵产生。因此,我们只能给出大致的猜测和推断。
按照韦斯特的理论,新陈代谢是一把双刃剑,它一方面摄入物质和能量,另一方面使得细胞磨损和凋亡。所以,生物体体型越大,单个细胞的新陈代谢率就越低,细胞磨损和凋亡的周期就越长,生物体老化的速度也会越慢,寿命越长。类比熵的话,细胞的磨损与凋亡对应了熵产生,而这一速度与它的新陈代谢率成正比。采用这个观点,韦斯特成功地解释了生物体寿命的规模法则。
然而这个观点的缺陷是,无法解释为什么熵产生会在某个时刻超越负熵流。负熵的获取显然也和新陈代谢有关,所以负熵流应该正比于生物体的新陈代谢率。这样,在生物体成长的过程中,负熵流和熵产生都会随着新陈代谢而成比例地增加,不会出现后者超越前者的时刻,因此也就无法解释生物体为什么会衰老、死亡。
在这里,我想给出自己的不同猜想。首先,负熵流正比于新陈代谢率;其次,我认为,熵产生并不与新陈代谢率成正比,而很可能满足一种超线性规模法则,即生物体的总熵产生速率与体重呈现幂指数大于1的幂律关系。这是因为能够产生熵的不仅仅是每一个构成单元(细胞)的新陈代谢,细胞之间的相互作用也会产生额外的熵。而且这一部分额外的熵产生取决于细胞总数和细胞之间的交互方式,并且很可能随细胞数的增多而增多。这样,若全部细胞熵产生的总量与生物体体重成正比,那么生物体熵产生的总量就会与细胞数呈现超线性规模法则,如图5所示。

在生长发育阶段,由于生物体本身就是一个高度有序的结构,因此其摄入负熵流的速度应大于自身熵产生的速度,这样整体才会变得越来越有序、越来越成熟——这就是生物体的生物量的累积和增长。随着生物体进一步生长,用于维护的能量流会比新陈代谢率更快地增长,因此必然存在一个特殊的阶段,用于维护的能量流与摄入的能量流刚好平衡,因此生物体停止生长,进入成熟的阶段。
从负熵流和熵产生的角度来说,随着生物体体重的增加,熵产生的增长要远快于负熵流的增长。所以,尽管早期负熵流大于熵产生,但很快就会反转。因此,生物体逐渐老化,由盛转衰。值得注意的是,负熵流和熵产生的平衡点并不一定与能量流的平衡点重合。前者有可能比后者出现得更早,但不可能更晚。
这是因为,按照我们的假设,当生物体停止生长后,它的熵产生率恒定不变。所以,熵的平衡点不可能出现在停止生长以后。因此,在生物体停止生长之前,其内部熵产生的速度已经比它从外界获取负熵流的速度更快了,即未老先衰。但是由于这时熵积累得还并不多,所以我们无法观察到衰老现象。
4. 能否逃脱死亡
我们不妨考虑这样一种可能性,即负熵流与熵产生的平衡点刚好与能量流的平衡点重合,那么,此时生物体有没有可能逃脱死亡的命运呢?
答案是,除非生物体处于非常严格的静息状态,使得摄入的能量流刚好用于平衡细胞凋亡,从而保证没有额外的熵产生,否则生物体仍然会老化、死亡。但是这种平衡很难长久维持,因为生物体并不是静止的死物,它需要进行一系列额外的活动,包括觅食、求偶,甚至思考,等等,这些活动需要额外的能量注入,这会导致各个器官、细胞的额外磨损,也就是熵产生。实际上,熵产生不仅与能量流有关,还与能量流的涨落有关。所以,额外的活动不仅带来了与能量流成正比的熵产生,还由于能量流波动而导致额外的熵产生。这样,熵产生的速度就会大于静息状态下原本用于维护的熵产生速度,也就大于通过新陈代谢获得负熵流的速度,所以生物体开始积累熵,也就是开始走向衰老和死亡。因此,衰老的本质就在于额外的熵产生。
这也可以解释,为什么古代的中国和印度存在通过长时间打坐延长寿命,甚至达到长生不老的传说,也许这些古老的修行方式可以大大降低熵产生率吧。
2.2 规模不变量
另一种值得深入探究的问题是规模不变量(scale invariance)。本书指出,无论是生物体、互联网社区还是城市,它们的背后都存在一些“规模不变量”,也就是不随规模缩放而变化的量。
例如,哺乳动物一生的心跳总次数就不随生物体规模变化。这一常数的发现很有可能将我们引向更深层次的原理。
比如,我们不妨假设,生物体就是一个类似于潮汛的周期脉冲,这个脉冲的总量不变。该总的脉冲次数为生物体提供了一生所需的“能量”,用完了脉冲,生物体就死亡了。于是,如何利用这种脉冲呢?有两种策略,在生态学中分别称为R策略和K策略。R策略的办法是尽可能快速应用这个脉冲,从而提高一切生命活动的频率,然而这种生物体的寿命通常不长。很多小型生物就采用了R策略的生存方式。K策略则是尽可能降低生物体的新陈代谢率,从而延长寿命,但它们往往行动不够灵活。很多大型动物就采取了K策略的生存方式。R策略和K策略就像是一枚硬币的两面,各有利弊。R策略和K策略的背后有一个共同制约因素,这就是前面说的脉冲总量。生物体还存在很多类似的规模不变量。
在社会系统中也有类似的例子。比如,我们发现每一个人对于社会交互(链接)和多样性的权衡存在认知能力的上限(见第6章)。这个上限不随社区规模而变化,这一发现有可能也蕴含着更基本的原理。或许,每个人的认知复杂度类似于物理学中的守恒量,不会随所处环境的系统规模变化而变化。所以,当你把更多认知资源分配到了社会交互和链接上,个人技能多样性就会相应降低。
前面曾提到,复杂系统之所以具备规模法则,原因在于它们具备规模缩放对称性。而规模不变量的发现,则恰恰告诉我们,当规模缩放的时候,保持不变的具体物理量是什么,它们才是这个复杂系统背后的本质。因此,挖掘更多的规模不变量是未来研究的另一重点。
更进一步,这种规模不变量的发现也许可以帮助我们发现更深层次的守恒律。物理学中的诺特定理(Noether Theorem)可谓“最美的数学定理”。该定理给出了一般物理系统中对称性与守恒量之间的对偶关系。比如,我们知道物理定律应该是空间对称的,也就是说,在不同的地点验证爱因斯坦方程应该得到同样的结论。而诺特定理指出,这一对称性必然蕴含着一种守恒量——动量。换句话说,动量守恒这个看起来非常本质的原理并非空穴来风,而是空间对称性的必然产物。再比如,能量守恒原理之所以存在,也是因为物理定律满足时间平移对称性的要求,即今天和明天能得到同样的物理定律。可以说,现代物理理论基本是围绕对称性和守恒量建立起来的。
同理,复杂系统的这些已知的规模不变量是否也有助于我们发现新的、属于复杂系统的守恒定律呢?让我们拭目以待吧。
在科幻小说《基地》中,作者艾萨克·阿西莫夫构想了一门特殊的学问——“心理史学”(psychohistory),它可以对大规模(数十亿)的人类群体做出异常精准的定量化预测。小说中心理史学的奠基人哈里·谢顿将这门学问应用到了包含2000万颗星球的银河帝国长达3万年的历史中,并精准预测出每一次社会革命爆发的时间甚至人类做出的选择。可以说,心理史学是所有心理学、社会学、经济学学者的终极梦想。然而,这样的理论可能存在吗?
坏消息是,人类迄今为止尚不具备开发这样一套理论的条件。好消息是,我们的确找到了一些蛛丝马迹,可以用来精确地刻画互联网社区、城市,而且它的适用范围可能包括人类群体以外的复杂系统,这就是本书讨论的全部内容——规模法则。
然而,规模法则仅仅是开启神秘大门的钥匙,它的背后可能通向一个全新的领域。这里,请允许我斗胆将这一全新的领域称为“复杂系统的物理学”(physics of complex systems)或简称“复杂物理学”。
简单来说,“复杂物理学”就是将物理学研究范式,也就是第谷→开普勒→牛顿的范式应用到复杂系统之上,并希望获得复杂系统背后的普适原理。一旦这一大胆的想法获得成功,也许它就可以像“心理史学”那样精准地预测社会、经济系统、企业、生物体的“生老病死”等基本行为特征了。人们就可以得到一套关于各类复杂系统的“新万物理论”了(见第1章)。
然而,问题的关键在于,复杂系统背后真的存在普适原理吗?为了更好地回答这个问题,我们先来回顾一下复杂科学的发展历史。
3.1 历史背景
早在20世纪30年代,贝塔朗菲提出了系统论,这标志着早期系统科学的诞生。与一般学科不同的是,以系统论为代表的理论属于横断学科,也就是它们尝试打破传统学科,如生物学、物理学、经济学等的边界,抽象出不同系统背后统一的规律,如多个单元如何组成系统,单元之间如何通信,我们如何对一个系统实施调控,等等。以系统论、信息论、控制论为代表的“老三论”的成功创建,让人们领略到了横断学科的魅力和跨学科研究普遍问题的重要性。
于是,从20世纪中叶以来,横断科学不断扩大自己的战果。从混沌理论到分形几何,再到“新三论”,即耗散结构论、协同学和突变论,人们将数学和物理学中发展出来的新概念、新方法广泛应用于各式系统之中。
到了20世纪80年代,美国圣塔菲研究所的建立标志着复杂科学的诞生,这是系统科学的一次大升级。人们不再将目光局限在简单的、线性的系统,而对广泛存在的复杂系统产生了浓厚的兴趣。复杂系统大多具有类似于生命的特性,包括自组织、自适应、自学习、混沌边缘,等等。然而,传统的数学、物理建模方法在面对复杂系统时开始表现出力不从心。复杂系统中的非线性相互作用,使得即使我们可以建立数学方程,也很难对它进行求解和分析,例如著名的“三体”问题。新的研究方法呼之欲出。
20世纪90年代,计算机技术的飞速发展使得科学家们可以在个人计算机上模拟复杂系统,以探究大量非线性方程背后的涌现现象和规律。人们终于找到了分析复杂系统的利器——计算机模拟。于是,人工生命、元胞自动机、人工股票市场等基于多主体的计算机模型被相应提出,将真实世界中的复杂现象再现于计算机模拟世界中。
然而,没过十年,计算机模拟方法就显现出了各种弊端。最主要的问题是它的构建需要大量的假设,于是科学家们凭借自己的经验和直觉将一条条简单规则变成了计算机代码,然而这些规则和代码可能与真实的复杂系统没有任何关系。这样,基于计算机模拟的复杂科学研究变成了科学家们的“计算机游戏”。
就在此时,大数据技术的流行与普及又让人们看到了希望,因为这些数据记录了各式复杂系统运行的真实现象。于是,以阿尔伯特·巴拉巴西(Albert Barabasi)和邓肯·瓦茨(Ducan Watts)为代表的科学家们一头扎进真实的数据中,尝试从中提取出网络并发现规律。于是,复杂网络研究于世纪之交兴起,一时间,复杂网络几乎成为了复杂科学的代名词。
大数据显然推动了复杂科学的发展,然而,缺乏理论指导的数据研究很容易让科学家们陷入“只见树木不见森林”的窘境。由于现实中的数据过于多样化、领域化,因此由这些数据驱动的科学研究开始逐渐围绕数据打转。一个好的数据集就可以让科学家们在顶级期刊上发表一系列论文。渐渐地,人们忘记了来时的路——寻找普适性的原理。
到了今天,复杂科学开始慢慢淡出学者们的视线,人们甚至耻于寻找不同复杂系统背后的共性和规律,认为搞清楚一个个具体系统的机制,才是破解复杂系统奥秘的必经之路。越来越多的学者认为,复杂系统的统一理论诞生遥遥无期。
所谓合久必分,分久必合。复杂系统研究发展到21世纪,基本上处于“分”的状态。然而,此时我们更应该关注它朝“合”的发展趋势。
2017年,《规模》一书横空出世。规模理论正是在逆势而为。它一方面基于大量的实证数据,弥补了单纯的计算机模拟方法的不足;另一方面它始终围绕规模、规模法则、新陈代谢、生长、死亡等基础而深刻的话题展开,从而避免迷失在大量的具体学科知识和大数据之中。正当几乎所有学者都认为统一的复杂系统理论不可能的时候,规模理论的提出让我们看到了新的希望。它将第一性原理和大量实证数据恰当地结合到一起,将经典物理学中的第谷→开普勒→牛顿的研究范式进一步发扬光大,拓展了普利高津的耗散结构论,以至于它可能延展成一门新的物理学,关于复杂系统的物理学。
无独有偶,就在2021年的10月份,诺贝尔物理学奖授予了以复杂大气系统为代表的复杂物理系统(complex physical systems)的基础性研究。这是时隔44年之后,复杂科学再一次受到诺贝尔奖的青睐。获奖者乔治·帕里西(Giorgio Parisi)是一名统计物理学家,它与韦斯特一样,也在寻找不同复杂系统(如鸟群、大气系统等)的共性。那么,这是否意味着复杂科学的发展将会迎来春天,迈上新的台阶呢?
3.2 “复杂物理学”是可能的吗
“复杂物理学”这样一种研究各类复杂系统共性的物理学是可能的吗?我倾向于认为这是可能的,有如下三个理由。
第一,不同的复杂系统之间显然具备广泛的相似性。当我们从夜晚的高空俯视城市,就会发现被夜光照亮的道路很像一根根血管,小汽车很像血液里的红细胞。当我们打开细胞内部,就会发现它简直就像一个小型的工厂。虽然科学不能建立在类比的基础上,但是这些遥远的相似性显然暗示了不同复杂系统背后可能存在统一规律。“复杂物理学”应该致力于发现这些普适规律。
第二,大量研究成果已经揭示了复杂系统存在普适规律。无论是“老三论”“新三论”、混沌、分形、幂律,还是本书重点介绍的规模理论,一个个确定的规律摆在我们眼前,虽然离普适原理还很远,但是它们的确暗示了普适规律的存在。
第三,规模理论中的一些重要结论已经告诉我们该理论背后可能存在类似于基本物理原理的复杂系统规律,包括它与耗散结构理论的关系、规模不变量的发现、模型背后的统一性,等等。
然而,对这一问题再多的论证也仍然疏于对“复杂物理学”深入而具体的研究。尽管描绘“复杂物理学”未来的样子非常困难,但是我们不妨从反面,即什么不是“复杂物理学”来推测它未来的大致样子。
3.3 “复杂物理学”不应该是什么样子
首先,“复杂物理学”不应该是回答微观、细节问题的学问。诸如哪只股票会暴涨?张三应该如何做出选择?这些问题无疑是实际的、有意义的,但并不是“复杂物理学”应该关心的。该学科应该更多关注宏观的、框架性的问题。例如,人类能否通过科技手段延长寿命?哪个城市最先可能遇到奇点?到2050年,城市将会创造多少产值?等等。
其次,“复杂物理学”并不是将复杂系统还原为物理系统,用经典的物理理论加以研究,而是将第谷→伽利略→牛顿的思维范式和分析方法——数据→唯象规律→一般性原理,应用到复杂系统之上。因此,复杂物理学中的“物理”二字指的是采用物理学的研究方法,而不是关注物理学的通常研究对象。
再次,“复杂物理学”不应该只关心某一学科的特殊问题。复杂科学研究的魅力就在于它的跨学科性和横断性。因此,如果我们要总结出一套物理学理论,那么它也应该继承这一特点。当然,这并不意味着“复杂物理学”不能解决某一学科的单一问题。在一些特定情境下,结合一些学科的具体知识或数据,“复杂物理学”也可以解决特定问题。
除此之外,“复杂物理学”又不等同于复杂科学,后者包含前者,二者之间存在微妙的区别。尽管都在关注复杂系统背后的普适规律,但前者更强调那些可以定量表达并求解的规律,而后者不局限于此。比如,涌现这一概念是长久以来复杂科学关注的主题之一,但是它尚难以量化,因此并不是当前阶段“复杂物理学”应关注的主题。再比如,规模理论显然是“复杂物理学”的一个典型例子,它只关心规模、幂律等这些简单的概念和规律,但可以获得精确、定量的描述。进一步,“复杂物理学”更像是在寻找构成复杂系统的必备条件和最小约束,在这些约束下,复杂系统如何演化仍然存在巨大的空间。例如,对于生命来说,“复杂物理学”关心生死存亡这些物理约束,但不关心它们所绽放出来的生命火花——意识、情感、智能等。而意识、情感、智能是如何涌现的,恰恰是复杂科学要回答的问题。
3.4 呼唤新的数学
也许,就像牛顿在发明了微积分这一重要的数学工具之后才能构建出宏伟的牛顿力学体系一样,要想构建出“复杂物理学”这一新的理论,也需要一套全新的数学工具。在分析各种复杂系统时,我们会经常与分形、幂律、规模法则等概念打交道。而尺度作为一个与空间、时间平行的变量,必然会进入我们的基本方程之中。那么,一种能够耦合空间、时间和尺度的数学工具也许是必不可少的。
可喜的是,数学界在最近几年慢慢发展出了一套类似的数学工具,这就是分数阶微积分(fractional calculus)。通过将最基本的微积分运算扩展到分数维上,人们构建了一座新的数学大厦。然而可惜的是,目前人们使用这套数学工具分析复杂系统的例子还不是很多。另外,该工具本身也在不断完善中。
与分形、幂律、规模法则等概念相关的还有物理中的临界相变理论(theory of criticality and phase transition),甚至分析临界现象的重要工具——重整化群(renormalization group)。重整化群方法的工作原理是通过尺度变换将系统进行缩放,然后根据规模变化下的不变量来推导系统应满足的特性,包括各种幂律分布、规模法则等。然而,针对一个具体系统,如何构造重整化操作并不是一个简单的问题。
也许,只有等到一套专门用于分析临界相变的数学工具出现,才有可能构建“复杂物理学”。
尽管“复杂物理学”的前景令人心潮澎湃,但很显然,这套理论还处于萌芽阶段,尚存在非常多的不足。为了让读者获得更全面、更无偏的认识,这里我们专门对本书内容进行批判,并尝试做出一定的回应。
4.1 理论自身的不完善之处
不可否认,该理论尚存在很多不完善的地方。比如,我们应该不仅能从理论模型推导出各种规模法则的幂指数,还应该能够推导出它们的系数。然而,就目前的几乎所有模型来说,都没有给出关于系数的解释。就克莱伯定律来说,我们知道它的系数与温度有关,然而无论是WBE模型还是巴拿瓦网络模型,都不包括任何有关温度的因素。因此,可以说目前的理论仍然不具有完全的可预测性。
再比如,从基本的规模法则出发,我们虽然可以推导出城市的生长方程,然而该方程并没有经过严格的验证。韦斯特仅用纽约市这一个例子来与模型进行比对,而且比较结果更偏向于定性,这显然与生物学中的生长方程差距很大。关于城市中奇点临近等结论也存在很多值得怀疑的地方。
另外,在很多其他系统中,我们尚未发现生长与死亡的相应规律。虽然这并不意味着这样的规律不存在,但我们尚无法证明本书中谈到的规律是否适用于所有复杂系统,或者理论适用的边界究竟在哪里?这对规模理论的发展提出了质疑。
4.2 真的存在统一理论吗
未来的“复杂物理学”研究的是一套制约不同复杂系统运行的底层规律。然而,这样的统一规律是否真的存在呢?贯穿本书始终的规模法则的确可以让我们看到希望:不同的复杂系统存在统一的幂律方程。然而从这些幂律方程出发探寻其背后更底层的规律时,我们针对不同系统得出了完全不同的机制模型。
例如,生物体的克莱伯定律帮助我们挖掘出了WBE模型、巴拿瓦网络模型,城市的超线性规模法则、亚线性规模法则帮助我们挖掘出了层级化道路网络模型和匹配生长模型。然而,这些模型是有针对性的,制约不同复杂系统的统一规律尚未浮出水面。这不禁让我们怀疑,不同复杂系统背后的统一原理是否真的存在?
如果真的存在这样的统一原理,显然,就要在各式各样的模型背后找到它们的统一性。例如,第4章所讨论的巴拿瓦网络模型就试图将生物系统和河流系统甚至各类抽象的流网络统一起来,第5章的“挖雷”模型则有可能建立广义克莱伯定律和超线性规模法则之间的联系,第6章和第7章就试图用匹配生长模型统一解释互联网社区和城市的生长规律。这些都是沿着统一理论的道路前进的一些尝试。
4.3 寻找反例
如果从头到尾纵观本书的所有章节,你会发现双对数坐标系下的直线似乎贯穿始终,用幂律函数形式表达的规模法则随处可见。开始的时候,你会觉得这些方程能够适用于不同场景很是新奇,但到了后来,你可能便会产生这样的疑问:怎么又是这样的直线、这样的方程,难道就没有不同的形式吗?
当我们对正例——服从规模法则的情形积累了足够多的实例之后,自然就会对反例——不服从规模法则的实例,更感兴趣了。那么,在本书讨论的这么多例子之中,是否存在反例呢?答案是肯定的。
事实上,在互联网社区和企业中,我们都看到了反例。
如果我们将某互联网社区每一小时的总活动数与活跃用户数画在一个双对数坐标系中,就会发现这些数据点可能形成两条或者多条直线,这些直线的斜率会明显不同。比如,当用户数小于1000的时候,直线斜率较小;而在大于1000的时候,直线斜率较大。这说明,整个社区在发展过程中经历了不同阶段,以1000用户数这个规模为分界,遵循不同的发展模式。
再比如,当我们研究企业的时候,也会发现很多行业的规模法则的规律性并不明显,这体现为在双对数坐标系下,数据点更加分散,而不是集中在一条直线的两侧。这说明,该行业中的企业并不存在明显的相似性。
这些都构成了反例。尽管理论尚无法针对这些反例给出相应的合理解释,但是对它们的深入研究会帮助我们找到规模法则及其推论的理论边界,从而预测出哪些情况是理论本身不能预测的。
4.4 现有理论是完备的吗
虽然我们已经发现了大量规模法则,但是,这些是否已经足够了?这些规模法则是否同等重要?去掉其中一两个是否有关系?这些规模法则之间的关系又是什么?
所以,关键在于我们关注的问题是什么。假如我们关注的问题仅仅涉及不同复杂系统的新陈代谢、生长与死亡,那么广义克莱伯定律这一个规模法则就足够了。但是,假如我们关注的问题是城市如何更好地发展,包括环境、交通、经济等各个方面。那么,仅仅关注社会交互的超线性规模法则显然不够,我们需要引入更多规模法则。所以,一味空洞地讨论理论完备性没有任何意义,我们必须首先清晰地界定问题是什么。
当问题确定了之后,我们便可以对规模法则进行取舍,并明确最小的一组规模法则集合。例如,我们关注生物体的生长、衰老和死亡等问题,则只需要关注克莱伯定律这一条规模法则就行了,因为由它可以推导出其他规律。
这种由一条规模法则可以推导出其他规模法则的特性值得我们高度注意,因为这意味着规模法则彼此之间并非完全独立。找到不同规模法则之间的联系,有助于我们理解复杂系统背后的运行机制。就像第6章中讨论的多样性与链接度的规模法则之间的关系帮助我们找到了重要的规模不变量,就是一个很好的例子。
4.5 模型的不唯一性
除了规模法则以外,我们还介绍了大量模型,包括WBE模型、巴拿瓦网络模型、匹配生长模型,等等。然而,这些模型都存在一个很大的局限性,就是它们并不是解释规模法则的唯一可能模型。
比如,为了解释克莱伯定律的起源,我们可以使用WBE模型,也可以使用巴拿瓦网络模型。再比如,为了解释城市中超线性规模法则的起源,我们可以使用贝当古模型,也可以使用扩展的匹配生长模型。甚至,在一篇综述文章中[3],作者列举了十多个模型,都可以解释超线性规模法则。因此,越多的模型可能给我们带来越多的困惑。
那么,如何对这些模型进行比较和筛选呢?著名的“奥卡姆剃刀原理”也许可以派上用场。如果很多模型可以解释同一类现象,那么最简单的模型大致就是最好的。
然而,这里存在一个困难的问题:一组不同的模型除了解释我们最关注的现象以外,还会有一些副产品,这些副产品大多并不相同。例如,WBE模型和巴拿瓦网络模型都可以解释克莱伯定律,但是它们各自能推导出一系列其他结论,WBE模型局限在生物体内部网络,而巴拿瓦网络模型对生物体内部网络的解释性较差,但可以扩展到对河流网络、水槽等物理系统的解释。这为我们对这些模型进行取舍带来了一定的困难。
4.6 理论有何用途
不可否认,本书所论述的理论大多尚无法直接用于实践,但是这并不意味着当前的研究丝毫没有用途。比如,第5章提到的有关百度贴吧用户黏性的计算方法也可以用于度量其他互联网社区。再比如,本书第9章就提出了一种利用规模法则进行企业评估的方法,它很有可能在未来获得应用。这些都充分说明了这些理论的实际应用价值。未来的潜在应用还包括对城市发展的诊断、对企业生长的预测、对互联网社区的评估与预测等。
然而,这些浅显的应用对于“复杂物理学”的宏大图景来说可谓不值一提。“复杂物理学”就像是襁褓中的婴儿,过早开发必然不利于其茁壮成长。我们应该给予它更多的耐心。当我们找到了真正的底层原理以后,理论的应用将可能超乎想象。
4.7 研究范式是否已然过时
在本书中,我们一直采用的是“第谷→开普勒→牛顿”的基本研究范式,即从实证数据出发,挖掘出有价值的唯象规律,在此基础上构建理论框架。
很多人认为,在大数据、人工智能时代,这种牛顿式的研究方式已经过时了。有了人工智能,人们甚至可以直接从大数据中找到想要的答案,该范式的后面两步似乎可以直接省略。例如,AlphaFold可以用于蛋白质结构预测,机器学习算法可以用于新药物开发,等等。“面向科学的人工智能”(AI for science)已经成为人工智能的一个独立分支。
然而,我认为大数据、人工智能的方法和本书所采用的基本研究范式各有千秋,前者适合回答具体而微观的问题,后者则适合回答宏观甚至定性的问题。
首先,不应否认大数据、人工智能方法的强大作用,甚至我自己也在进行相关研究。大数据、人工智能的方法通过海量数据和快速计算能够迅速挖掘出我们想要的信息。这种方法更适合解决诸如明天天气如何、哪只股票可能大涨这样的具体问题。只要数据量足够大,机器学习就有可能通过调节成千上万个参数将输入变量和输出变量的相关关系拟合出来。然而,这种方法不适合回答本书感兴趣的宏观问题。原因在于,对于复杂系统来说,可观测变量非常多,而问题通常是模糊不清的。在这种情况下,就无法利用大数据的方式,因为可能的变量组合太多了。这个时候,人的直觉会起到关键作用——猜想出真正重要的变量和关系。
与之相对,物理学的方法能够为人工智能和大数据提供可能的探索方向。虽然“复杂物理学”关注的是宏观、大尺度、机械性的问题,并不能直接解决微观问题,但是这并不意味着宏观的方法丝毫没有用处。事实上,宏观变量通常可以对微观变量起到支配作用。所以,两种方式相结合才是解决问题的最好办法。
有趣的是,人工智能的大模型本身就是一个复杂系统。因此,复杂科学的概念、原理与方法显然也适用于这些模型。例如,近期的研究表明[4],经过大规模训练的人工智能大模型具有各式各样的涌现现象,而且这些涌现现象与这些神经网络模型的规模法则可能有关[5]。
尽管规模理论还存在很多问题,“复杂物理学”也仅仅是一个希望的开始,但是,将人类运用了几百年的第谷→伽利略→牛顿的研究范式应用到复杂系统本身,仍然是一个值得探索的重大方向。
即使关于复杂系统的大一统理论并不存在,复杂系统作为21世纪重要的研究对象仍然值得我们高度关注。人工智能、气候危机、人体的本质、生命的起源,这一切重大科学问题都离不开对复杂系统的深度认识。寻找这一切复杂系统背后的科学规律既是对人类的挑战,又是人类解决自身问题的希望。
-
克莱伯定律
https://wiki.swarma.org/index.php/克莱伯定律
-
规模法则
https://wiki.swarma.org/index.php/规模法则
-
匹配生长随机几何图模型
https://wiki.swarma.org/index.php/匹配生长随机几何图模型
-
流网络
https://wiki.swarma.org/index.php/流网络
全书目录

全书目录
(目录可上下滑动查看)
购买信息
推荐阅读