Nat. Commun. 速递:深度学习预测复杂网络系统韧性
导语
刘志航 | 作者
论文题目:Deep learning resilience inference for complex networked systems 论文链接:https://www.nature.com/articles/s41467-024-53303-4
1. 巴拉巴西的韧性推理框架(GBB 框架)
1. 巴拉巴西的韧性推理框架(GBB 框架)
图1:GBB 框架在预测网络韧性时的局限性。(a-c)描述了共生动力学(mutualistic dynamics)、基因调控动力学(gene regulatory dynamics)、神经元动力学(neuronal dynamics)网络,其中r表示度关联系数(assortativity,同配性)。中性(neutral)同配性意味着节点连接是随机的,而负同配性表示高度连接的节点倾向于与低度连接的节点相连,正同配性高度节点更倾向于与其他高度节点连接。(d-f)显示了 GBB 框架的韧性预测结果。红色和蓝色曲线分别表示正常功能状态和系统崩溃状态下,平均邻居活动水平xeff与βeff的关系,并给出了临界点。当βeff小于临界点时,系统被推断为非韧性;否则,被推断为韧性。然而,GBB 模型对有负或正度相关性的网络给出不准确的推断。(g-i)核密度估计图展示了节点活动的稳定状态分布,实际模拟表明,有些网络系统的韧性推断与 GBB 框架相反。例如,图 (g) 中的 Network (II) 尽管被 GBB 框架认为非韧性,但实际有且只有一个非平凡的正常功能稳定状态,显示它实际是韧性的。非平凡稳定状态(non-trivial stable state)描述的是一个复杂系统非零的稳定状态。这与平凡稳定状态形成对比,后者通常代表系统所有节点活动为零,完全崩溃。
2. 基于深度学习的网络韧性预测(ResInf)
2. 基于深度学习的网络韧性预测(ResInf)
图2. ResInf 框架的工作原理分为三个主要模块:系统动力学编码器、拓扑编码器和 k 空间投影器。系统动力学编码器:使用堆叠的 Transformer 编码器层从输入的节点状态轨迹中学习节点状态动力学的表示。这一模块无需任何先验知识,通过建模节点状态之间的复杂相关性生成密集表示。拓扑编码器:使用图神经网络(GNN)对输入的邻接矩阵进行建模,通过消息传递机制递归聚合来自邻居节点的特征,生成每个节点的多跳邻域的区分性拓扑表示。k 空间投影器:将学习到的系统动力学和系统拓扑结构的表示聚合到一个虚拟全局节点中,提供系统级的特征表示。随后,通过多头自注意力网络动态融合这些轨迹表示,并使用降维网络将其投射到 1 维 k 空间,以实现准确的韧性推断。
然而,值得注意的是,ResInf 依赖于需要标签的监督学习架构,而这些标签(系统是否具有韧性0,1标签)在现实中往往很难获取,尤其是在复杂或动态变化的系统中。这在没有充分观测数据的场景下可能导致模型表现下降。而GBB不依赖监督信号,因此深度学习方法和传统的复杂系统建模分析方法(如GBB)在不同场景下各有优劣。ResInf 可能更适合在真实世界中可以获得大量观察数据的复杂系统,比如实验室的微生物系统,这类系统的节点活动动力学方程无法明确描述,因此传统的分析方法难以适用。这篇论文在微生物系统韧性预测的数值结果显示,ResInf 达到了显著的准确率,平均 F1 分数高达 0.829。研究人员进一步的实验显示,利用与真实微生物生态系统韧性丧失模式相似的合成系统数据预训练模型,可有效迁移到动力学方程未知的真实系统,取得与在真实数据上训练相当的预测性能,平均 F1 分数也可达到 0.807。对 ResInf 的这一应用方式为解决对真实数据采集和标注的依赖提供了一种行之有效的路径。
图3. 真实世界微生物系统的韧性预测。(a)不同物种的相对丰度,颜色区分物种,韧性系统中的物种丰度存在稳定态,非韧性系统中物种丰度波动剧烈。(b)不同模型的 F1 得分对比。(c)使用 SIS 网络动力学生成的合成系统数据进行预训练后,模型在推断这些真实微生物系统韧性方面的性能。
图4. ResInf 及其他基线方法的韧性推断表现。(a)共生、(b)基因调控和(c)神经动力学网络
3. 模型的泛化能力与可解释性
3. 模型的泛化能力与可解释性
图5:ResInf 的 k 空间决策表现及与 GBB 和 SDR 的比较。ResInf 在k空间中实现了韧性系统与非韧性系统的更清晰线性分离,表现出更强的韧性预测能力。
4. 人工智能与统计物理的关系
4. 人工智能与统计物理的关系
尽管复杂网络的观测数据越来越多,获取高质量的节点活动轨迹和网络拓扑仍然是一项挑战,特别是在需要大规模实验室环境的真实网络中以及准确的韧性标签数据。作者也强调 ResInf 可以应对两类主要韧性丧失模式,但未明确如何处理未来可能发现的新韧性丧失模式。如果这些新模式与已知模式显著不同,ResInf 的泛化能力可能会受到影响,表现出次优性能。在出现这些未预见的新韧性丧失模式时,ResInf 可能需要大幅度调整或重新训练,这可能导致无法迅速应对突发的网络系统问题。对此,论文作者指出,可以将这些新型模式纳入 ResInf 的预训练集中以帮助应对这一挑战。
同时,尽管 ResInf 通过 k 空间映射提供了一定程度的解释性,但相比于传统的分析方法,如 GBB 提供的明确数学推导,这种解释性仍显得不够直观。这可能限制 ResInf 在对可解释性要求高的应用场景中的使用,例如在电网管理或流行病防控中,决策者通常需要明确的因果关系或数学逻辑支持,特别是需要具体到中尺度的网络拓扑恢复的策略指导。当应用场景的系统动力学过程可用明确的公式描述时,传统的分析方法,如 GBB 等提供的明确因果关系和数学推导逻辑可以与 ResInf 通过数据驱动的方式得到的k空间映射形成有效的互补和验证。基于统计物理的理论分析方法和基于深度学习的数据驱动方法可以相互协同,为决策者提供更为全面的分析框架。
论文作者进一步阐述了 ResInf 在网络拓扑恢复方面的应用。具体来说,在实施拓扑结构恢复和节点重燃[3]后,可将重组的系统拓扑结构和节点的状态演化过程输入 ResInf。恢复后网络在 k 空间中的映射 k 值可作为确定韧性恢复的指标,进而使我们能够改进和优化设计的恢复策略。这种观点将恢复的重点从孤立的单节点干预措施转移到更综合、更系统的方法,优先考虑网络的结构完整性及其组成部分之间的协同关系,这对于应对复杂的现实挑战至关重要。
数据驱动的复杂系统韧性预测
复杂系统自动建模读书会第二季
“复杂世界,简单规则”。
集智俱乐部联合复旦大学智能复杂体系实验室青年研究员朱群喜、浙江大学百人计划研究员李樵风、清华大学电子工程系数据科学与智能实验室博士后研究员丁璟韬、美国东北大学物理系Albert-László Barabási指导的博士后高婷婷、北京大学博雅博士后曹文祺、复旦大学数学科学学院应用数学方向博士研究生赵伯林、北京师范大学系统科学学院博士研究生牟牧云,共同发起「复杂系统自动建模」读书会第二季。
读书会将于9月5日起每周四晚上20:00-22:00进行,探讨四个核心模块:数据驱动的复杂系统建模、复杂网络结构推断、具有可解释性的复杂系统推断(动力学+网络结构)、应用-超材料设计和城市系统,通过重点讨论75篇经典、前沿的重要文献,从黑盒(数据驱动)到白盒(可解释性),逐步捕捉系统的“本质”规律,帮助大家更好的认识、理解、预测、控制、设计复杂系统,为相关领域的研究和应用提供洞见。欢迎感兴趣的朋友报名参与!
复杂系统自动建模读书会:从数据驱动到可解释性,探索系统内在规律|内附75篇领域必读文献
6. 加入集智,一起复杂!
点击“阅读原文”,报名读书会