关键词:社交网络,自我中心网络,强弱联系,社交痕迹,累积优势机制



论文题目:Universal patterns in egocentric communication networks
论文来源:Nature Communications
原文链接:https://www.nature.com/articles/s41467-023-40888-5

这篇发表于Nature Communications的最新论文主要研究自我中心网络(Egocentric network)中联系强度的普遍模式。自我中心网络围绕个体展开,包括与家人、朋友和熟人之间的关系。研究发现,这些网络中存在少数强关系和更多弱关系,即少数核心亲密关系被大量较弱的关系所包围。这种结构模式的出现与维护社交关系的限制有关,包括有限的信息处理能力、社交认知和时间可用性。

我们都知道,社交网络中的强关系和弱关系是异质的,他们往往在社交关系中担任不同的角色。然而,人们对强弱关系的异质性在社交网络中的普适性及其驱动机制的了解还不是很清晰。这篇文章通过研究数百万人在几个月时间内的在线交流数据集,发现了关于关系强度分布及其个体层面变化的普适性规律。这些规律适用于不同的通信关系,甚至适用于那些不一定反映离线社交互动的渠道。

在线交流数据集包含了不同类型的时间戳交互元数据,包括移动电话通话、社交媒体等,时间跨度从几个月到几年不等。这些数据反映了社交行为的不同方面,例如朋友之间的电话通话、工作相关的电子邮件,以及在互联网论坛或约会网站上的消息,这些行为可能或可能不反映离线社交关系。通过重构数据中的社交网络,研究人员测量了大量自我中心网络中关系强度的分布,并关注这个分布在个体之间的变化。他们比较了在表示不同通信渠道的几个数据集中的观察结果,并利用这些观察结果构建了一个简化且可分析的自我中心网络增长模型,该模型解释了关系强度的异质性。

通过自我中心网络演化模型,这篇文章将异质性归因于累积优势机制,类似于比例增长和偏好依附等机制。相反,关系分布的均匀性与对交流对象的有效随机选择相关这两种机制之间的平衡决定了自我中心网络中关系强度的多样性。这些结果揭示了社交网络中关系强度异质性的驱动机制,并对社交网络结构和个体行为的理解具有重要意义。

图1. 连接强度是异质的并受累积优势驱动。图a显示了一个选定的egos(个体)与其k个熟人之间的实时联系序列(左),和对应的通信活动的时间轴(右)。该序列被分为两个连续的时间段,事件数量相同(I1和I2)。随着时间的推移,一些熟人之间的交流比其他人更频繁。图b显示了图a所示表示的聚合的自我egos网络(左),和熟人活动分布(右侧)。a(0), t, σ分别表示该活动中的最小活跃水平,活跃次数平均值和标准差。图c展示了在将个体依据离散度进行四分类的条件下,至少具有活动水平a的熟人数量的互补累积分布函数 (CCDF)。对于较大的离散度d,egos与熟人之间的交流是异质的。图d显示了图c中数据的离散度分布p(d),显示了更多的异质egos。图e展示了在图d中每个离散度分布p(d)范围内,在活动a中熟人被连接的相对概率 π(a )-〈1/k〉,在个体和时间上做平均后的值。图中random choice的基线表示的是熟人被根据 π(a )=〈1/k〉随机连接时的情况。对于异质的egos,增加的趋势表明了累积优势,即具有较高先前活动的熟人接收到更多事件。图f展示了在16个通信渠道中,至少具有离散度d的egos数量的互补累积分布函数(CCDF)。图g展示了所有数据集中的相对连接核 π(a)-〈1/k〉。在所有渠道中,增长趋势表明累积优势的存在。


图2. 改变活动的简单模型显示社交痕迹形状的交叉。图a展示了在一个度为k的模拟自我egos网络中,研究者考虑了熟人的活动水平以及它们在特定事件时间τ参与新的通信事件的概率π(a)。其中,熟人的当前活动水平为a,参数α用于插值累积优势(α→-a0,顶部)和随机选择(α→∞,底部)之间的行为。这些动态导致了一个自我网络,其中熟人的平均活动水平(即时间)为t = τ/k。右侧的图表和网络以示意图的形式展示,但对应于k = 5,a0 = 1,α = -0.9(103),以及顶部(底部)的t = 3(103)。图b展示了熟人在时间t时具有活动水平a的概率p(a),在不同的t值下的变化,其中α在顶部(底部)为-0.7(9),k = 100,a0 = 1。数值模拟与理论计算非常吻合,表明累积优势和随机选择分别导致广泛或狭窄的活动分布。图c展示了重新调整参数αr= α + a0和tr= t – a0后,给出的活动离散度d的相图。偏好性参数β = t(r)/α(r)在β = 1(虚线)处展示了异质和均匀区域之间的交叉点。垂直的灰色虚点线是图d的参数值。图d展示了在不同的t值和α(r)= 0.3(上)和α(r)=10(3)(下)的情况下重新调整的活动分布p(a)。异质区域在p(a)中展示了伽玛尺度,均匀区域展示了高斯尺度。所有的模拟结果都是对10(4)次实现的平均值。


图3. 模型揭示社交痕迹的多样性和持久性。图a展示了在Mobile (call)数据集中,根据α(r) = α + a(0)和t(r )= t – a(0)的不同取值,展示了egos数量N(α,t)的热图。大多数egos(95%)具有异质的社交特征。在交叉点β = 1的另一侧,少数egos(5%)具有更均匀的联系强度。图b展示了在a部分数据集中的所有egos,根据在异质(β > 1)或均匀(β < 1)区域中至少具有活动水平a的熟人数量的CCDF(补余累积分布函数)。图c展示了在16个通话、短信和在线交互数据集中,估计出的1/β的CCDF。所有的系统都显示出多样化的社交特征,66-99%的egos倾向于与少数熟人进行交流,而1-34%的egos则表现出均匀的交流模式。图d展示了,当在两个连续的活动区间(I1和I2)中计算β时,具有给定熟人流动率J和相对优先性变化Δβ/β的egos数量N(J,Δβ)。这些计算基于egos进行,显示了熟人流动率和相对优先性变化的边际数值分布。这表示无论熟人的流动性如何,社交特征在个体层面上都是持久的。图e展示了所有研究数据集中相对优先性变化p(Δβ)的分布。社交特征的持久性在不同的通信渠道中是系统性的。




编译|曹子悦

计算社会科学读书会第二季



详情请见:

数据与计算前沿方法整合:计算社会科学读书会第二季启动



推荐阅读

1. Chaos 速递:社交网络中感知偏见下的意见传播级联
2. 以数据驱动的社交网络和多智能体模型模拟社会韧性
3. PRX 速递:为什么社交网络中存在六度分隔理论?
4. 张江:第三代人工智能技术基础——从可微分编程到因果推理 | 集智学园全新课程
5成为集智VIP,解锁全站课程/读书会
6. 加入集智,一起复杂!


点击“阅读原文”,报名读书会