motif标签传播算法MWLP:利用高阶结构进行社区发现
导语
网络社团检测(或图聚类)对于揭示复杂网络的结构性质至关重要。标签传播算法作为一种重要的网络社团检测方法,可以在线性时间复杂度内找到网络中的社团结构,不过标签传播算法存在一些问题,比如可能忽略对于社团检测至为关键的网络高阶结构。本文提出使用网络的高阶信息 motif,捕捉网络结构特征,提升标签传播算法的性能。基于多个现实世界数据库的实验结果表明该方法的优越性。
研究领域:社团结构,高阶网络
无知影 | 作者
知乎 | 来源
论文题目: Community Detection by Motif-Aware Label Propagation 论文地址: https://dl.acm.org/doi/pdf/10.1145/3378537
论文贡献
-
使用代表性模体(motif of interest)刻画网络的高阶特征。
-
整合高阶与低阶结构信息并据此设计了一个新的带权网络。
-
提出了一个新的投票策略NaS用于降低标签传播过程中的随机性以获得更稳定的社区结构。
标签传播算法(LPA)
标签传播过程示意图(图中数字表示节点社区标签)
利用高阶结构进行社区发现:MWLP算法
为了解决上面的问题,本文提出的MWLP算法可以分为以下几步:
1. 找到输入网络的代表性motif
2. 利用代表性motif重构网络权重
基于模体的带权标签传播算法(MWLP)示意图
找到输入网络的代表性motif
利用代表性motif重构网络权重
标签更新策略Nas
记 Γ(ν) 为节点ν的邻居(同时考虑高阶和低阶连接) 集合,对于其中任意一个邻居 ,其投票分数的计算如下:
-
Ci是邻居i所携带的标签
-
表示节点ν的邻居中携带标签Ci的数目
-
W(ν, i)衡量的是节点ν和其邻居i基于motif的亲密程度
-
λ∈[0, 1]是一个平衡参数用于调节邻居数量和连接质量的影响,λ可根据不同网络结构进行调节
实验
-
作者首先设计了一个人工网络,其中每个节点在初始状态携带各不相同的社区标签。在同样的网络设置下,分别运行原始的LPA算法和MWLP算法多次,结果如下面两个图所示。从图中不难看出,原始的LPA算法在多次运行之后产生的社区结构各不相同,而MWLP得到的结果却较为稳定且社区结构也让人颇为满意。(本文实验所使用的motif都是无向的motif,个人感觉使用有向的motif效果会更明显)
-
作者将MWLP应用于7个真实数据集,并同多个社区发现算法进行对比,实验结果也显示了MWLP的优越性(尽管MWLP未能在全部数据集上均取得最高评估分数,但其平均排名在两个评估指标上均位列前三,且相比于其他算法MWLP的复杂度很低,只有O(m1.5) ,其中m是边的数量)
-
作者还讨论了参数λ的不同取值对MWLP算法的影响(个人感觉其实没啥影响,按照二八原则取0.2或者0.8就可以了)
高阶网络读书会启动
随着对现实世界探索的不断深入,人们发现在许多真实的复杂系统中,组成系统的个体之间不仅存在二元交互关系,也广泛存在多个体同时(或以特定顺序)进行交互,即高阶交互现象。为此,研究人员分别发展出了基于超图、单纯复形、依赖关系等的网络高阶表示模型,为复杂网络分析和研究提供了新的思路。为了促进此领域的交流与合作,我们发起了【高阶网络读书会】。
集智俱乐部读书会是面向广大科研工作者的系列论文研读活动,其目的是共同深入学习探讨某个科学议题,激发科研灵感,促进科研合作。【高阶网络读书会】由电子科技大学吕琳媛老师、任晓龙老师及中国地质大学(北京)管青老师联合发起,每周分享时间为每周四 19:30-21:30 进行,预计持续 10-12 周。这其间,我们将围绕高阶交互网络的基本概念、模型、方法与应用等研究进行研讨,本次读书会分享会按照「基础理论」+「深入理论」+「案例研讨」的模式展开。
详情请见:
推荐阅读
-
玛丽女王大学 Ginestra Bianconi:高阶网络的拓扑结构与动力学 -
脑网络中的高阶拓扑结构 -
经典回顾:社会传播的高阶网络模型 -
《张江·复杂科学前沿27讲》完整上线! -
成为集智VIP,解锁全站课程/读书会 -
加入集智,一起复杂!