导语


长连边(Long Ties)是跨接不同社区结构的关系纽带,被广泛认为在社交网络中加快信息传播、促进跨领域合作等方面发挥着至关重要的作用,也称“社会桥(social bridges)”。然而,一些现有的网络理论及预测模型研究表明,长连边在网络演化过程中可能会迅速瓦解或结构冗余化,从而失去作为信息传播桥梁的价值。这也给研究者探究长连边是否能持久、稳定得扮演社会桥的角色带来了疑问。来自上海交通大学、普渡大学和麻省理工学院的一组研究人员对动态社交网络的实证分析表明,长连边关系比其他社会关系持续更加持久,并处于一个稳定的状态。该研究通过图机器学习及计算经济学模型的交叉,建模了动态网络的动力学过程,解释了长连边能够带来更多收益,从而激励人们投入更多时间精力来维系长连边关系。结果表明长连边比许多现有理论和模型所预测的更稳定、更持久。该研究也指出,能够进行社会干预以促进长连边的形成,例如将异质性个体混合,以促进社会效益的增加。


集智俱乐部组织的「计算社会科学读书会」第二季已经启动报名,将聚焦讨论Graph、Embedding、NLP、Modeling、Data collection等方法及其与社会科学问题的结合,并针对性讨论预测性与解释性、新冠疫情研究等课题。读书会6月18日开始,持续10-12周,详情见文末。


研究领域:社交网络,复杂网络,图嵌入,计算社会学

吕丁、袁源 | 作者

刘志航 | 译者

邓一雪 | 编辑



论文题目:
Investigating and modeling the dynamics of long ties
论文链接:
https://doi.org/10.1038/s42005-022-00863-w





1. 长连边:

看似很弱,对网络传播却至关重要




试着想想你的朋友圈,与你互动最多的人是谁?可能首先会想到你的同事或亲密的朋友。当然,由于有很多共同好友,或者经常参加同一个活动或项目,你和他们往往有很多交流互动。从社交网络结构的视角来看,你们拥有更多的共同邻居节点,或拥有更高的社会嵌入度。与此同时,你可能也会想到一些常与你保持社交的人,但并没有共同的朋友或重叠的社交圈。
 
从社交网络的角度来看,后者通常被认为是“长连边关系(Long Ties)”。图1说明了应该如何从拓扑视角定义社交关系中的长连边——当直连关系被切断时,一个节点到另一个节点至少需要经过多长的网络距离?当最短替代路径足够长(例如需要通过六条连边),将被称为长连边。长连边被广泛认为对于不同社区之间传播新信息至关重要,被称为“社会桥(social bridges)”。
 

图1. 网络中长连边的定义。连边跨度由两个相连节点之间的第二短路径的长度表征。蓝色节点是两个红色节点之间的第二短路径的链路。最右边的网络中两个红色节点的第二短路径跨越了6条连边,因此连边跨度为6。 

 
从网络结构上讲,长连边表征跨度较大的社会联系,连边跨度可以由两个相连节点之间的第二短路径的长度来衡量。小世界网络中,重连连边通过连接更远范围的两个节点,呈现小世界特性。其中跨度较大的重连连边则是长连边。与嵌入到内聚网络中强连边相比,长连边在结构上通常被认为是弱关系。在社交网络研究中,大量研究集中在紧密聚集的社会关系和群体是如何形成的,以及它们如何演变、传播信息和行为以及促进群体团结等问题上,但较少研究关注长连边关系。
 
此外,关于长连边的研究中缺乏了对社交网络中长连边的动力学分析。一些针对静态社交网络数据的结论可能无法直接推广到动态网络的分析中。特别是一些现有的社交网络理论和预测模型间接暗示了长连边在演化中会迅速消散或结构冗余化,从而质疑长连边关系的长期价值。当社会联系缺乏足够的共同邻居来加强他们的关系或当他们很少互动时,这种关系很可能会迅速瓦解。或者,长连边可能演变成嵌入式“短连边”。根据三角闭合理论, 一个人若将其他朋友介绍给他的长连边好友,演化形成的重叠的朋友圈使得长连边关系切换为短连边关系。由于社会嵌入度增加,两个人在信息及观点层面逐渐同质化。
 
然而,尽管长连边看起来很弱(就互动的频率或时长而言),但有研究表明,长连边对于新信息和传染性行为的广泛传播至关重要,并且这些长连边出乎意料地与嵌入度较高的社交关系具有相同水平的交互频率(连边强度) [2]。这一结果也暗示了长连边可能具有一些其他特殊的特征,例如表现出更高水平的直接互惠性。
 
图2. 大规模社交网络,黄色高亮部分为长连边。
 
 



2. 长连边比想象中更稳定




这项最新发表在 Nature子刊Communications Physics 上的研究侧重于实证分析长连边的动力学并提出计算社会学模型,旨在进一步解释长连边的形成和演化机制。该研究使用一个两年时长的大规模动态社交网络数据,这项研究发现,从长远来看,长连边关系甚至比嵌入式社交关系具有更多的互动(图3所示)。为了进一步确定这一结论的鲁棒性,该研究分别调节阶段周期为一个周、一个月或半年等,发现曲线趋势始终保持一致。区别于连边强度,该研究也定义了连边寿命这一指标,结果表明长连边的寿命很长,人们倾向于长期维系这种关系
 

图3. 八个阶段的连边强度(a. 互动频次;b. 互动时长)的演化,每三个月一个阶段,连边分类根据其在第一个阶段的连边跨度。

 
通过针对不同阶段的连边跨度的转移概率矩阵的分析,该研究发现多数的连边呈现三角闭合特性,演化为嵌入式“短连边”,此外,长连边的绝大多数还是保持相对稳定的连边跨度(图4所示)。并且,稳定的长连边的连边强度及持续概率相对更高(图5所示)。根据动态分析,长连边在网络演化过程中具有一个稳定的状态,即持久、稳定的“社会桥”。
 
图4. 连边跨度的转移概率矩阵
 
图5. 连边跨度演化时的连边强度及持续概率
 
为了解释这一发现,该研究提出了三个假想,即度异质性、幸存者偏差、价值长连边理论。通过进一步分析,该研究发现前两者只能部分解释其发现。价值长连边理论,假设长连边能够连接异质性较高的个体,具有更强的直接互惠性,从而促进双方投入时间精力来维系这类社会关系。
 
 



3. 长连边带来更多价值




为了解释在实证分析中的发现,该研究提出了一个计算社会学模型来验证第三种假想,即长连边带来更多收益,促进人们对维系长连边关系的付出。长连边能够为异质性个体提供新的信息或不同的专业知识。
 
该模型结合机器学习中的图嵌入技术和计算经济学模型[3],设计了社会关系形成及演化过程的两步机制:随机相遇和理性选择。所提出的两步模型考虑了社会关系的动态性,即人们首先随机相遇,然后对社会关系做出理性的选择。选择过程假设个人在决定他们的社会关系时是理性的,通过维系更具收益的社会关系最大化他们的效用函数。
 

图6. 模型学习到的平均收益(a)、平均直接影响(b)和平均间接影响(c)。

 
模型的分析结果表明,长连边能够带来更多价值,表现为直接互惠性(图6所示),从而激励人们付出更多时间来维系它们。该模型能够解释为什么长连边比现有理论和模型之前所预测的要更稳定、更持久,并且随着时间的推移可能会变得更加强大。该模型也解释了社会交换的好处推动了这种稳定性。
 
这项工作的结果也启示研究者,促进长连边形成的社会干预的重要性,例如将不同背景的人混合在一起。实证分析和建模结果都表明,属性异质性或网络距离较远的社会关系显著提升了交互效用。然而,模型发现这些人相遇的可能性很小,可能会阻碍他们未来互动的形成。除了分析的电话交流网络之外,还有许多其他类型的社交联系,例如社交媒体、离线互动或协作网络。因此该研究最后呼吁对这一重要主题进行更多研究,以验证他们结论的外部有效性。
 
注:本文翻译以下文章并结合论文做了一些补充
文章链接:https://socialsciences.nature.com/posts/social-bridges-are-more-stable-than-you-thought

参考文献:
[1] Granovetter, Mark S. “The strength of weak ties.” American journal of sociology 78.6 (1973): 1360-1380.
[2] Park, Patrick S., Joshua E. Blumenstock, and Michael W.  Macy. “The strength of long-range ties in population-scale social  networks.” Science 362.6421 (2018): 1410-1413.
[3] Yuan, Yuan, Ahmad Alabdulkareem, and Alex Sandy Pentland.  “An interpretable approach for social network formation among  heterogeneous agents.” Nature communications 9.1 (2018): 1-9.  


计算社会科学读书会第二季


计算社会科学作为一个新兴交叉领域,越来越多地在应对新冠疫情、舆论传播、社会治理、城市发展、组织管理等社会问题和社科议题中发挥作用,大大丰富了我们对社会经济复杂系统的理解。相比于传统社会科学研究,计算社会科学广泛采用了计算范式和复杂系统视角,因而与计算机仿真、大数据、人工智能、统计物理等领域的前沿方法密切结合。为了进一步梳理计算社会科学中的各类模型方法,推动研究创新,集智俱乐部发起了计算社会科学系列读书会。


新一季【计算社会科学读书会】由清华大学罗家德教授领衔,卡内基梅隆大学、密歇根大学、清华大学、匹兹堡大学的多位博士生联合发起,自2022年6月18日开始,持续10-12周。本季读书将聚焦讨论Graph、Embedding、NLP、Modeling、Data collection等方法及其与社会科学问题的结合,并针对性讨论预测性与解释性、新冠疫情研究等课题。读书会详情及参与方式见文末,欢迎从事相关研究或对计算社会科学感兴趣的朋友参与。



详情请见:

数据与计算前沿方法整合:计算社会科学读书会第二季启动


推荐阅读



点击“阅读原文”,报名读书会