集智

心速递

  • 多层网络可视化的现状;

  • 具有多变量传递熵和分层统计检验的大规模有向网络推理;

  • 地理在创新的复杂扩散中的作用;

  • 微分方程模型显示了欧洲学术界玻璃天花板的近因;

  • 来自Prigogine-Herman-Boltzmann方程的多类基本图;

  • 融合视觉、文本和连接的线索来研究心理健康;

  • 统计验证网络入门;

  • 狂热者是否会增加或减少社会网络中的两极分化?;

  • 用农业社区的推文预测美国州级农业情绪作为衡量粮食安全的措施;

  • 使用自然发生的同伴通知队列反事实估计网络效应;

  • 边替换语法:生成图的形式语言方法;

  • 从Twitter分享数据识别虚假新闻:一项大规模研究;

多层网络可视化的现状

原文标题:

The State of the Art in Multilayer Network Visualization

地址:

http://arxiv.org/abs/1902.06815

作者:

Mohammad Ghoniem (LIST), Fintan Mcgee (LIST), Guy Melançon (LaBRI, UB), Benoit Otjacques (LIST), Bruno Pinaud (LaBRI, UB)

摘要:使用简单的图在现实世界系统中建立实体之间的关系是一种标准方法。然而,现实更好地被视为几个相互依赖的子系统(或层)。最近,复杂系统领域出现了多层网络模型的概念。该模型可应用于各种实际数据集。多层网络的例子可以在生命科学,社会学,数字人文学科等领域找到。

在图可视化领域内,有许多系统可视化具有多层图的许多特征的数据集。该报告提供了当前多层网络可视化的最新技术和结构化分析,不仅适用于可视化研究人员,也适用于那些旨在可视化复杂系统领域中多层网络的人员,以及那些跨应用程序开发系统的人员。域。我们已经探索了可视化文献,以调查适用于多层图可视化的可视化技术,以及应用领域内的工具,任务和分析技术。该报告还确定了多层图可视化的突出挑战,并提出了解决这些问题的未来研究方向。

具有多变量传递熵和分层统

计检验的大规模有向网络推理

原文标题:

Large-scale directed network inference with multivariate transfer entropy and hierarchical statistical testing

地址:

http://arxiv.org/abs/1902.06828

作者:

Leonardo Novelli, Patricia Wollstadt, Pedro Mediano, Michael Wibral, Joseph T. Lizier

摘要: 网络推理算法是研究大规模神经成像数据集的有用工具。多变量传递熵非常适合于该任务,是一种无模型测量,其捕获时间序列之间的非线性和滞后依赖性以推断最小有向网络模型。已经提出贪婪算法来有效地处理高维数据集,同时避免冗余推断和捕获协同效应。然而,多次统计比较可能会增加假阳性率并且计算要求很高,这限制了先前验证研究的规模。

我们提出的算法 – 如在IDTxl开源软件中实现的 – 通过采用分层统计测试来控制家族错误率并允许有效的并行化来解决这些挑战。该方法在合成数据集上得到验证,该数据集涉及尺寸增加(最多100个节点)的随机网络,用于线性和非线性动态。性能随着时间序列的长度而增加,对于10000次样品,一致地达到高精度,回忆和特异性(平均> 98%)。改变统计显著性阈值显示更长时间序列的更有利的精确回忆权衡。网络大小和样本大小都比先前演示的大一个数量级,显示了典型的EEG和MEG实验的可行性。

地理在创新的复杂扩散中的作用

原文标题:

The role of geography in the complex diffusion of innovations

地址:

http://arxiv.org/abs/1804.01349

作者:

Balázs Lengyel, Riccardo Di Clemente, János Kertész, Marta C. González

摘要: 现代社会中的城乡差距正在扩大,正在影响经济和社会不平等以及政治激演化。这些观察到的趋势深深植根于社会的空间模式,并且需要在社会影响的网络模型中进行地理扩展。更好地了解新技术和新思想在各地扩散的方式可以为我们提供有关信息传播,技术进步和经济发展的新见解。在这项工作中,我们通过来自iWiW的独特数据集揭示了地理在创新空间扩散中的作用,iWiW是匈牙利的在线社会网络(OSN)。

我们分析了它从2002年到2012年的整个生命周期,在其受欢迎的高峰期以及随后与国际OSN平台的竞争失败之后消失了多达3亿友谊。通过在经验空间社会网络上应用复杂扩散模型,我们观察到具有相似倾向采用或混合混合的个体的联系在空间传播中是至关重要的。然而,预测采用的可能性是扩散模型的目标,并且在这些模型中对个体的先验标记将是矛盾的。或者,我们根据人口和关系距离的引力定律,揭示城镇创新者和早期采用者的数量规模。这些经验特征需要包含在复杂传染模型中。

微分方程模型显示了欧洲

学术界玻璃天花板的近因

原文标题:

A differential-equation model shows the proximate cause of the glass ceiling in European academia

地址:

http://arxiv.org/abs/1902.06813

作者:

Lennon Ó Náraigh

摘要: 我们引入一个基于常微分方程的模型来描述两个相互排斥的群体如何通过职业等级进展,无论是在单个组织中还是在整个经济部门中。预期的应用是欧洲大学学术层级顶部的性别不平衡,然而,该模型完全是通用的,也可以应用于其他环境。之前关于欧洲大学性别失衡的研究主要集中在大规模的统计研究上。我们的模型代表了一个出发点,因为它是确定性的(即基于常微分方程)。

该模型需要通过层次结构精确定义不同群体的进展率;这些是控制职业发展动态的关键参数。各组的进展率可以分解成一个产品:组成员在谁争夺晋升到下一级某一年层次较低水平的比例,再乘以在竞争的成功率有问题的组。这两个参数中的任何一个在所考虑的组中都可能不同;这会在组织的构成中引入群体不对称。我们引入玻璃天花板指数来简洁地总结这种不对称性。通过文献中的案例研究,我们展示了数学框架如何确定欧洲学术界玻璃天花板的近因。

来自Prigogine-Herman

-Boltzmann方程的多类基本图

原文标题:

Multi-class fundamental diagrams from the Prigogine-Herman-Boltzmann equation

地址:

http://arxiv.org/abs/1902.06814

作者:

A. R. Mendez, W. Marques Jr., R. M. Velasco

摘要: 我们在本文中的目的是建立一个来自类似气体动力学的交通流模型的多级交通流的理论基础图。我们首先对Prigogine-Herman-Boltzmann方程进行多类推广,以构建该系统的基本关系。我们表明存在一个临界密度,它取决于慢速和快速用户的相对浓度,并描述了找到阈值的过程。最后,我们对两类汽车混合物的流密度关系与文献中的经验数据进行了对比。

融合视觉、文本和连接

的线索来研究心理健康

原文标题:

Fusing Visual, Textual and Connectivity Clues for Studying Mental Health

地址:

http://arxiv.org/abs/1902.06843

作者:

Amir Hossein Yazdavar, Mohammad Saeid Mahdavinejad, Goonmeet Bajaj, William Romine, Amirhassan Monadjemi, Krishnaprasad Thirunarayan, Amit Sheth, Jyotishman Pathak

摘要: 随着社交媒体平台的普及,数百万人通过在社交媒体上自愿和公开地表达他们的思想,情绪,情感,情感,甚至他们与心理健康问题的日常斗争来分享他们的在线角色。与通过分析文本内容来研究抑郁症的大多数现有努力不同,我们使用包括个人层面人口统计学在内的各种特征来检查和利用多模式大数据来辨别抑郁行为。

通过开发多模式框架并使用统计技术来融合通过处理视觉,文本和用户交互数据获得的异构特征集,我们显著增强了当前用于在Twitter上识别抑郁个体的最新方法(提高了平均F1 – 评分为5%)以及促进社交媒体对更广泛应用的人口统计推断。除了提供人口统计与心理健康之间关系的见解外,我们的研究还有助于设计一种新的人口统计意识健康干预措施。

统计验证网络入门

原文标题:

A primer on statistically validated networks

地址:

http://arxiv.org/abs/1902.07074

作者:

Salvatore Miccichè, Rosario Nunzio Mantegna

摘要: 在本文中,我们讨论了网络分析的一些方法,这些方法提供了关于零假设的单链路或单节点的信息,同时考虑了经验观察到的系统的异质性。通过这种方法,当统计上拒绝零假设时,选择节点和链接是可行的。

我们将讨论重点放在使用(i)所谓的差异滤波器和(ii)二分网络中的统计验证网络的方法上。对于这两种方法,我们讨论了使用多个假设检验校正的重要性。讨论了统计验证网络的具体应用。我们还讨论了如何使用经统计验证的网络(i)预处理大型数据集和(ii)检测正在形成复杂系统中存在的节点簇的最紧密和稳定子集的社区核心。

狂热者是否会增加或减少

社会网络中的两极分化?

原文标题:

Do zealots increase or decrease the polarization in social networks?

地址:

http://arxiv.org/abs/1902.07084

作者:

Snehal M. Shekatkar

摘要: 狂热者是社会网络中的节点,他们不会在社会压力下改变他们的观点,并且在复杂网络的观点动态研究中被认为是至关重要的。在这里,我们表明他们的存在是否影响社会两极分化,敏感地取决于他们的拓扑特征,以及动态的初始条件。为此,我们首先量化网络节点可能存在于两个相反状态时的极化量。然后我们考虑两种类型的初始条件和两种类型的狂热分配。

使用两个不同的随机图模型作为底物,我们研究了极化动力学,因为对于所有四种组合,狂热者的比例是变化的。我们的结果表明,狂热者只有在网络中随机选择它们时才有效,并且使用随机初始条件。即使违反了其中一个条件,增加狂热者的分数也不会使极化值发生任何实质性变化。

用农业社区的推文预测美国州

农业情绪作为衡量粮食安全措施

原文标题:

Predicting US State-Level Agricultural Sentiment as a Measure of Food Security with Tweets from Farming Communities

地址:

http://arxiv.org/abs/1902.07087

作者:

Jared Dunnmon, Swetava Ganguli, Darren Hau, Brooke Husic

摘要: 在相关数据稀少的发展中地区获得准确的粮食安全指标的能力对于负责实施粮食援助计划的政策制定者至关重要。因此,大量工作致力于使用各种方法(包括模拟,遥感,天气模型和人类专家输入)预测重要的粮食安全指标,如年度作物产量。作为作物产量预测中现有技术的补充,这项工作开发了神经网络模型,用于预测来自农业社区的Twitter饲料的情绪。

具体来说,我们研究了直接学习在农业相关推文的小数据集上的潜力,以及从其他领域(例如〜政治)的较大的,标记良好的情绪数据集转移学习以准确预测农业情绪,我们希望最终能够作为有用的作物产量预测指标。我们发现从小的,相关的数据集中直接学习优于大型,完全标记的数据集的转移学习,卷积神经网络在Twitter情绪分类上大致优于递归神经网络,并且这些模型在实际特征上的三元情感问题上表现得差得多设置比在文献中经常发现的二元问题。

使用自然发生的同伴通知

队列反事实估计网络效应

原文标题:

Estimating Network Effects Using Naturally Occurring Peer Notification Queue Counterfactuals

地址:

http://arxiv.org/abs/1902.07133

作者:

Craig Tutterow, Guillaume Saint-Jacques

摘要: 随机实验或A / B测试用于通过创建两个平行的宇宙来估计特征对用户行为的因果影响,其中成员同时被分配到治疗和控制。然而,在社会网络设置中,成员进行交互,使得特征的影响不总是包含在治疗组内。研究人员开发了许多实验设计来估计社会环境中的网络效应。或者,自然发生的外源变异或“自然实验”允许研究人员在没有实验操作的情况下从观察数据中恢复同伴效应的因果估计。自然实验将工程成本和与网络随机化相关的一些伦理问题与寻找具有自然外生变异的情况的搜索成本进行权衡。

为了降低与发现自然反事实相关的搜索成本,我们确定了用于扩展大规模在线系统的常见工程要求,其中可能存在自然的外生变异:通知排队。我们根据通知队列的顺序在LinkedIn平台上识别两个自然实验,以估计收到的消息对接收者参与的因果影响。我们表明,接收来自其他成员的消息显著增加了成员的参与度,但是一些流行的观察规范,例如固定效应估计,高估了2.7倍。然后,我们将估计的网络效应系数应用于大量过去的实验,以量化它改变我们对实验结果的解释的程度。该研究指出了使用消息队列来发现自然发生的反事实以在没有实验者干预的情况下估计因果效应的益处。

边替换语法:生成

图的形式语言方法

原文标题:

Edge Replacement Grammars: A Formal Language Approach for Generating Graphs

地址:

http://arxiv.org/abs/1902.07159

作者:

Revanth Reddy, Sarath Chandar, Balaraman Ravindran

摘要: 作为结构化数据的模型,图越来越普遍。密切模仿给定图集的结构特性的生成模型在各种领域中具有实用性。许多现有工作要求从数据中估计大量参数,实际上是图的指数大小。我们采用略有不同的方法解决这个问题,利用正式图语法文献中广泛的先前工作。在本文中,我们提出了一个基于概率边替换语法(PERG)的图生成模型。我们提出了一种名为Restricted PERG(RPERG)的PERG变体,它类似于字符串语法文献中的PCFG。

通过这种限制,我们能够导出用于从图数据估计语法参数的学习算法。我们在实际数据集上凭经验证明RPERG优于现有的图生成方法。我们改进了最先进的基于Hyperedge替换语法的图生成模型的性能。尽管是无上下文语法,但所提出的模型能够捕获真实网络的许多结构属性,例如度分布,幂律和谱特征。

从Twitter分享数据识别

虚假新闻:一项大规模研究

原文标题:

Identifying Fake News from Twitter Sharing Data: A Large-Scale Study

地址:

http://arxiv.org/abs/1902.07207

作者:

Rakshit Agrawal, Luca de Alfaro, Gabriele Ballarin, Stefano Moret, Massimo Di Pierro, Eugenio Tacchini, Marco L. Della Vedova

摘要: 社会网络提供了一个现成的虚假和误导性新闻渠道,以传播和发挥影响力。本文研究了不同声誉算法在应用于通过Twitter传播的大量且具有统计意义的新闻部分时的性能。我们的主要结果是简单的基于众包的算法能够识别大部分虚假或误导性新闻,同时主流网站的误报率非常低。我们相信这些算法可以作为实用的大规模系统的基础,用于向消费者表明哪些新闻网站值得仔细审查和怀疑。

来源:网络科学研究速递

编辑:孟婕

声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。

近期网络科学论文速递

模拟交通网络和地区之间的相互作用 等5篇

复杂商业网络中的分层社区 等9篇

集体决策中的多样性与社会网络结构 等8篇

肿瘤连接组:绘制肿瘤内复杂交互网络 等27篇

多主体通信博弈中的涌现语言现象 等7篇

基于置信度的图卷积网络半监督学习 等8篇

加入集智,一起复杂!


集智

集智俱乐部QQ群|877391004

商务合作及投稿转载|swarma@swarma.org

搜索公众号:集智俱乐部

加入“没有围墙的研究所”

集智

让苹果砸得更猛烈些吧!

原文始发于微信公众号(集智俱乐部):集智