导语


找出描述高维复杂网络背后的简单规律,是很多学科研究的难点。10月15日发表于 Nature Communications 的一项新研究,介绍了基于双曲几何的复杂网络降维方法,将该方法应用于多种不同类型的复杂网络,如生物分子网络、大脑连接网络、社交网络及互联网,可以发现所有这些网络的维度在2-9之间。该研究不止提供了一种有效且普遍使用的降维方法,还为解释诸如复杂系统中普遍出现的临界现象提供了帮助。


关键词:复杂网络,双曲几何,降维

郭瑞东 | 作者

邓一雪 | 编辑


 

论文题目:

Detecting the ultra low dimensionality of real networks

论文地址:
https://www.nature.com/articles/s41467-022-33685-z





1. 降维方法简介




高维数据会使得数据点变得稀疏,额外参数会导致数据的可能性呈指数增长,而分散包含的数据点并删除它们之间有意义的关联,这在数学中被称为维度诅咒(curse of dimensionality)。为了降低维度,常用的方法基于数据点之间的相似距离,将相似点中差异较小的维度消除。在复杂网络中,连接之间的相似性由于节点的度分布具有尺度一致的特性,其维度可以看成是分形的,此时需要通过描述节点间的拓扑距离,来定义节点间的相似性。
 
双曲几何在复杂网络中已经用于多种任务,包括有效的导航,检测如自相似性、对称等模式、社区识别、网络重整化及构建缩小和扩大的网络副本。新方法基于复杂网络连通性的潜在双曲空间(latent hyperbolic space),可以在不进行先验的空间嵌入时,对辅助网络进行降维。通过节点聚类,还可找到降维后的最优维度,即该网络可被降到的隐含维度。
 



2. 对真实网络降维的结果




下图展示了使用该算法,对33个真实网络进行降维后,计算得到的隐含维度。可以发现,大多数网络具有非常低到中等的维数。
 
粉色节点为社交网络,其中线下朋友之间的社交维度最高,其次是Enron公司内的电邮网络,线上朋友的电邮网络,这反映了由包括年龄、性别、社会阶层和信仰或态度在内的多种社会学因素决定的人类互动中的同质性。PGP 信任网络和 EUEmail 网络的维度分别是1和3,是该类中明显的例外。前者是由加密程序用户之间的数字信任驱动的,而后者则代表一家大型欧洲研究机构成员之间的电子邮件通信。因此,这两种情况都背离了社会交往中的同质性假设。
 
有趣的是,协作网络(灰色,包括共同发表论文、作曲)的维度低于友谊网络,这表明在专业环境中社会动力更受限制。
 

图1:不同真实网络降维后得到的隐含维度,节点的大小代表具有相同维度的网络的个数

 
引文网络(黄色)处于中低维度区域(1-5),而语言和音乐术语共现网络(红色)的隐藏维度分别为5和6,需要更多的维度方可忠实描述。这意味着,尽管复杂网络在节点数量方面的维度比其总体规模低得多,但是通常需要不止一个相似维度来映射其复杂体系结构(知识本体间的关系比知识产生过程更复杂,包含额外的影响因素)。互联网尽管是一个技术网络,但其较高的维度反映了许多不同因素影响自主系统之间连接的形成,因此可能存在各种关系,例如买家-客户、兄弟姐妹或泛泛之交等
 
在生物学范畴(绿色)中,我们发现了一个维度较高的网络,与同一范畴中的其他网络相比,这个网络就是生物体黑腹果蝇中的遗传相互作用网络。这个网络观察到的更高维度可以理解,因为它是一个多重网络的单层投影,描述了不同类型的遗传相互作用。此外,大脑连接体的维度(浅蓝色)仍然接近其解剖时嵌入的欧式三维空间,而交通网络(深蓝色)略高于其地理嵌入的二维空间。
 
 



3. 总结




该研究首先提供一个可靠的基于双曲几何的复杂网络模型,可以特定的维度忠实地再现它们的结构,并找出最优的降维维度。其结果为通过将复杂网络系统嵌入到多维双曲空间中来超高效地降低复杂网络系统的维度铺平了道路。除了提供比双曲平面中二维地图更准确的描述外,多维双曲嵌入还有助于揭示决定复杂系统的连通性的已知因素与所确定的维度之间的相关性,例如交通或物流网络背后的经济和社会网络中的地理和文化因素。
 
此外,该研究可以用来从具有复杂结构的关系数据中创建预测模型,并帮助解决与维度有关的基本问题。在网络中,维度不仅对连通性的结构塑造有影响,而且对理解网络功能也至关重要,因为维度支配着网络的动态过程,如扩散和同步,以及临界行为。


高阶网络读书会启动


随着对现实世界探索的不断深入,人们发现在许多真实的复杂系统中,组成系统的个体之间不仅存在二元交互关系,也广泛存在多个体同时(或以特定顺序)进行交互,即高阶交互现象。为此,研究人员分别发展出了基于超图、单纯复形、依赖关系等的网络高阶表示模型,为复杂网络分析和研究提供了新的思路。为了促进此领域的交流与合作,我们发起了【高阶网络读书会】。


集智俱乐部读书会是面向广大科研工作者的系列论文研读活动,其目的是共同深入学习探讨某个科学议题,激发科研灵感,促进科研合作。【高阶网络读书会】由电子科技大学吕琳媛老师、任晓龙老师及中国地质大学(北京)管青老师联合发起,每周分享时间为每周四 19:30-21:30 进行,预计持续 10-12 周。期间,我们将围绕高阶交互网络的基本概念、模型、方法与应用等研究进行研讨,本次读书会分享会按照「基础理论」+「深入理论」+「案例研讨」的模式展开。



详情请见:

探索复杂系统高阶交互的奥秘 | 高阶网络读书会启动



推荐阅读



点击“阅读原文”,报名读书会