利用数据科学了解电影业的性别差距 | 网络科学论文速递8篇
核心速递
-
利用数据科学了解电影业的性别差距;
-
复杂网络中的轮廓接近中心性;
-
Syntgen:使用用户指定的拓扑生成含时网络的系统;
-
多层网络上的共传染扩散;
-
复杂网络中的快速影响者;
-
识别在线社交媒体中的长期周期性周期和集体情感记忆;
-
揭开集体关注中社会爆发的根源;
-
分析数字政治:双重视角下的挑战和实验;
利用数据科学了
解电影业的性别差距
原文标题:
Using Data Science to Understand the Film Industry’s Gender Gap
地址:
http://arxiv.org/abs/1903.06469
作者:
Dima Kagan, Thomas Chesney, Michael Fire
摘要: 数据科学可以为广泛的社会科学问题提供答案。在这里,我们将注意力转向电影中女性的写照,电影是一个对社会产生重大影响的行业,影响生活中的自尊和职业选择等方面。为此,我们将来自在线电影数据库 IMDb 的数据与电影对话字幕的数据集融合,以创建最大可用的电影社会网络语料库(16,303个网络)。
通过分析这些数据,我们调查了过去一个世纪中屏幕上女性角色的性别偏见。我们发现女性在电影中的角色各个方面都有所改善,包括女性角色的中心地位不断提升。通过着名的 Bechdel 测试的电影数量也有所增加,这是一种流行的 – 虽然有缺陷 – 衡量女性的小说。在这里,我们提出了一种新的更好的替代方案,用于评估电影中的女性角色。我们的研究介绍了新的数据,开放式代码框架和新技术,为电影的研究和分析提供了新的机会。
复杂网络中的轮廓接近中心性
原文标题:
Profile Closeness in Complex Networks
地址:
http://arxiv.org/abs/1903.06232
作者:
Divya Sindhu Lekha, Sruthi K S, Kannan Balakrishnan, Sreekumar A
摘要: 我们为复杂网络引入了一种新的中心度量,称为轮廓接近度。该网络属性源于对共识问题的图论分析。我们还证明了它在推断网络社区发展方面的相关性。
Syntgen:使用用户指定
的拓扑生成含时网络的系统
原文标题:
Syntgen: A system to generate temporal networks with user specified topology
地址:
http://arxiv.org/abs/1903.06277
作者:
Luis Ramada Pereira, Rui J. Lopes, Jorge Louçã
摘要: 网络表示可以帮助揭示复杂系统的行为。有用的信息可以从网络属性和不变量中派生,例如组件,集群或集团,以及它们随时间的变化。节点(或社区)集群的演变是研究的主要焦点之一。然而,时间维度增加了复杂性,引入了新的结构并需要新颖和增强的算法。尽管最近有所改进,但经验网络的时间戳表示相对稀缺,具有已知的基本事实,阻碍了算法验证。已经提出了一些方法来生成符合静态拓扑规范的合成时间网络,同时通常采用临时演化的 ad-hoc 方法。我们认为仍然需要从静态和时间角度来看符合问题域拓扑规范的原理合成网络生成器。在这里我们介绍这样一个系统。
我们系统的独特属性包括在用户控制下接受任意节点度和簇大小分布以及时间演化,同时支持可调联合分布和节点度的时间相关性。理论贡献包括分析群集内和群集内节点度和群集大小的序列的“可绘制性”条件,以及开发用于搜索节点的群集成员资格的最小化群集之间的共享信息距离的启发式算法。我们的工作表明,该系统能够在用户控制的拓扑下生成网络,具有多达数千个节点和数百个具有强拓扑依从性的集群。通过宽松的要求,可以实现更大的网络。生成的网络支持算法验证以及问题域分析。
多层网络上的共传染扩散
原文标题:
Co-Contagion Diffusion on Multilayer Networks
地址:
http://arxiv.org/abs/1903.06327
作者:
Ho-Chun Herbert Chang, Feng Fu
摘要: 我们研究了三个扩散要素的界面:传染之间的协同作用,每个传染的休眠率,以及多重网络拓扑。休眠被定义为一种较弱的“免疫”形式,其中休眠节点不再积极参与扩散,但仍然易受感染。所提出的模型扩展了关于阈值模型的文献,我们用它来显示不同图结构之间错综复杂的相互依赖关系。
我们的综合模拟表明,首先,较快的扩散传染会在较慢的扩散传染上引起分支;第二,网络半径与休眠在降低休眠方面存在正相关关系;第三,当两个远程图配对时,更快的传播传染取决于两个休眠率,而较慢的传染依赖于它自己;最后,协同传染对休眠不太敏感,并且有更广泛的扩散窗口。此外,当配对远程和空间约束图时,在空间图上发生环疫苗接种,其描述由于休眠的周围节点引起的部分扩散。空间传染取决于两种休眠率,而远距离传染仅取决于其自身。
复杂网络中的快速影响者
原文标题:
Fast influencers in complex networks
地址:
http://arxiv.org/abs/1903.06367
作者:
Fang Zhou, Linyuan Lü, Manuel Sebastian Mariani
摘要: 复杂网络中的有影响的节点通常被定义为最大化感兴趣的扩散过程的渐近范围的那些节点。然而,对于诸如病毒式营销和在线信息传播的实际应用,人们通常有兴趣在短时间内最大化该过程的范围。来自不同研究领域的网络相关研究中影响因素的传统定义将焦点缩小到传播过程的晚期状态,使得以下问题得不到解决:哪些节点能够在有限的范围内启动大规模的传播过程多少时间?
在这里,我们发现节点之间存在根本区别 – 我们称之为“快速影响者” – 在短时间内启动最大范围的流程,以及传统的“迟到”影响者。在这一观察结果的刺激下,我们提供了一个关于中心度指标的广泛基准,以及它们识别快速和晚期影响者的能力。我们发现可以使用本地网络属性来揭示快速影响因素。
特别是,一个简约的本地中心度量(我们称之为社会资本)在所有分析的经验网络的快速影响者识别中实现了最佳或接近最优的性能。在传统的,晚期影响者识别任务中,本地指标往往也具有竞争力。
识别在线社交媒体中的长
期周期性周期和集体情感记忆
原文标题:
Identifying long-term periodic cycles and memories of collective emotion in online social media
地址:
http://arxiv.org/abs/1903.06410
作者:
Yukie Sano, Hideki Takayasu, Shlomo Havlin, Misako Takayasu
摘要: 传统上,通过对有限数量的人进行问卷调查来评估集体情绪。最近,互联网上的书面文本的大数据已经可用于分析非常大规模的集体情绪。虽然集体情感和现实社会现象之间的短期反思已被广泛研究,但由于缺乏长期持久数据集,迄今尚未研究集体情感的长期动态。在这项研究中,我们从36亿日本博客文章中提取了10年期间的集体情绪。
首先,我们发现集体情绪表现出明显的周期性周期,即每周和季节性行为,伴随着自然灾害引起的脉冲。例如,四月以高张力为代表,可能是由于在日本上学。我们还确定了集体情绪中的长期记忆,其特征在于几个月内自相关函数的幂律衰减。
揭开集体关注中社会爆发的根源
原文标题:
Unraveling the Origin of Social Bursts in Collective Attention
地址:
http://arxiv.org/abs/1903.06588
作者:
Manlio De Domenico, Eduardo G. Altmann
摘要: 在社交媒体时代,每天都有数十亿人在社会技术系统中制作内容,导致大量信息泄露。然而,人类的注意力是有限的资源,并且为了一个人的兴趣消费最合适的内容越来越具有挑战性。事实上,信息不堪重负的社会系统中个人和社会活动之间复杂的相互作用导致集体注意力的突发活动仍然很难理解。在这里,我们通过分析特殊活动期间数百万用户的在线活动来解决这一挑战,从 NBA 总决赛到教皇弗朗西斯选举和引力波的发现。我们观察到集体注意力的极端波动,我们能够通过考虑两个基本因素的共同现象来表征和解释:社会互动的异质性和对有影响力的用户的优先关注。我们的研究结果表明,简单机制的结合是如何为复杂的社会现象。
分析数字政治:双重
视角下的挑战和实验
原文标题:
Analyzing digital politics: Challenges and experiments in a dual perspective
地址:
http://arxiv.org/abs/1903.06640
作者:
Géraldine Castel (ILCEA4), Genoveva Vargas-Solar (ILCEA4), Javier Espinosa-Oviedo (TU Delft)
摘要: 社会网络已成为过去十年政治生活的核心。然而,对于那些有兴趣在选举时分析政党和候选人的传播策略的人来说,将互联网引入政治领域已经证明是一种喜忧参半的祝福。实际上,虽然检索,咨询和存档与特定活动相关的原始文档已经变得更容易,更快,并且可以在更大范围内实现,因此开辟了一个有前途的 El Dorado 用于该领域的研究,研究在线活动也不可避免地引入了新的技术,方法和法律方面的挑战已经变得越来越复杂,人文和社会科学领域的学者需要自己解决。
因此,本文提出从一个专门用于比较的 POLIWEB 多学科项目中提供经验和实验验证的反馈。 2014年法国和联合王国欧洲议会选举前社交媒体上的政治运动分析。结合人文学科对与此类项目相关的问题的观察,本文还提供了有关三个数据收集生命周期阶段的实验结果:收集,清洁和存储。结果是一个数据收集准备进行分析,用于各种目的,旨在解决所考虑的政治科学问题。
来源:网络科学研究速递
编辑:孟婕
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。
近期网络科学论文速递
集智俱乐部QQ群|877391004 商务合作及投稿转载|swarma@swarma.org 搜索公众号:集智俱乐部 加入“没有围墙的研究所” 让苹果砸得更猛烈些吧!
◆◆◆
原文始发于微信公众号(集智俱乐部):集智