集智

心速递

  • 增长图的生成图卷积网络;

  • 社会网络中信息访问的差距;

  • 多重网络中多目标干预的共识排名;

  • 稀疏数据的符号链路预测:人格信息的作用;

  • 用于用户身份链接的图神经网络;

  • 文化模因的演化动力学及其在大规模电影数据上的应用;

  • 交通网络中个体路由随机性的全局益处;

  • 多层网络中的结构保留社区:定义、检测和分析;

  • 从嘈杂的流行病级联中学习图;

  • Twitter发声:国家灾难情境意识案例;

  • 慷慨、自私和利用作为资源共享的最佳贪婪策略;

  • 旅行中心性:带有非瞬时链路行进时间的含时多路游走;

  • 从Arxiv预测研究趋势;

  • 丹麦、德国和荷兰的城市尺度率,及其与治理结构的关系;

  • HEAT:属性网络的双曲嵌入;

增长图的生成图卷积网络

原文标题:

Generative Graph Convolutional Network for Growing Graphs

地址:

http://arxiv.org/abs/1903.02640

作者:

Da Xu, Chuanwei Ruan, Kamiya Motwani, Evren Korpeoglu, Sushant Kumar, Kannan Achan

摘要: 对增长图的生成过程建模在社会网络和推荐系统中具有广泛的应用,其中冷启动问题导致与现有图分离的新节点。尽管学习图表示和图生成的新兴文献,但它们中的大多数都无法处理孤立的新节点而没有非平凡的修改。由于以下事实产生了挑战:在观察到的图中学习生成节点的表示很大程度上依赖于拓扑特征,而对于新节点,只有节点属性可用。

在这里,我们提出了一个统一的生成图卷积网络,通过对从观察到的图数据构建的图生成序列进行采样,在生成模型框架中自适应地学习所有节点的节点表示。我们优化了由图重构项和自适应 Kullback-Leibler 发散正则项组成的变分下界。我们在几个基准引用网络数据集上展示了我们的方法的卓越性能。

社会网络中信息访问的差距

原文标题:

Gaps in Information Access in Social Networks

地址:

http://arxiv.org/abs/1903.02047

作者:

Benjamin Fish, Ashkan Bashardoust, danah boyd, Sorelle A. Friedler, Carlos Scheidegger, Suresh Venkatasubramanian

摘要: 社会网络中影响力最大化的研究在很大程度上忽略了这些算法可能对社会网络中包含的个体产生的不同影响。个人可以高度重视接收信息,例如职位空缺或贷款广告。虽然网络中心连接良好的个人可能会收到通过网络分发的信息,但连接不良的个人系统性地接收信息的可能性较小,从而在个人之间获取信息方面存在差距。

在这项工作中,我们研究如何最好地在社会网络中传播信息,同时最小化这种访问差距。我们建议使用 maximin 社会福利函数作为目标函数,其中我们最大化在干预下接收信息的最小概率。我们证明,在这种情况下,这种福利函数限制了访问间隙,而最大化预期的节点数量却没有。我们还研究了使用 maximin 的困难,并给出了标准贪婪策略的硬度结果和分析。最后,我们研究了对 maximin 进行优化的实用方法,并给出了一个经验证据,即一个简单的基于贪婪的策略在实践中运作良好。

多重网络中多目

标干预的共识排名

原文标题:

Consensus ranking for multi-objective interventions in multiplex networks

地址:

http://arxiv.org/abs/1903.02059

作者:

Márton Pósfai, Niklas Braun, Brianne A. Beisner, Brenda McCowan, Raissa M. D’Souza

摘要: 高中心节点对网络行为的影响不成比例;因此,控制这些节点可以有效地将系统引导到期望的状态。现有的多路复用中心度量通常对节点进行排序,假设层在质量上相似。然而,许多真实系统由本质上异构的网络组成,例如,社会网络可以具有不可知和附属层。

在这里,当结构,动力学和我们的干预目标在每个层的质量上不同时,我们使用秩聚合方法来识别多路网络中的干预目标。考虑到它们的不同功能和期望的结果,我们的方法是在每一层中分别对节点进行排序,然后我们使用 Borda 计数或 Kemeny 聚合来确定共识排名 – 预期共识排名中的顶级节点将同时有效地平衡竞争目标所有图层。

为了证明共识排名的有效性,我们将我们的方法应用于基于程度的节点删除过程,以便我们的目标是销毁某些层中的最大组件,同时保持其他层中的大规模连接。对于任何多目标干预,最优目标仅存在于帕累托意义上;因此,我们使用共识排名的加权推广来研究竞争目标之间的权衡。我们使用模型和真实网络的集合来系统地研究多重网络结构如何影响这种权衡。我们使用多重中心性分布的 copula 表示来生成具有给定秩相关性的模型多路复用网络。这允许使用分别操纵每层的边中心度分布和层之间的相互依赖性,并使用分析和数值方法独立地研究两者的作用。

稀疏数据的符号链路

预测:人格信息的作用

原文标题:

Signed Link Prediction with Sparse Data: The Role of Personality Information

地址:

http://arxiv.org/abs/1903.02125

作者:

Ghazaleh Beigi, Suhas Ranganath, Huan Liu

摘要: 预测社会网络中的符号链接经常面临符号链接数据稀疏性的问题,即,仅给出了一小部分符号链接。当负链接的数量远远小于正链接的数量时,问题就会恶化。提升符号链路预测需要额外的信息来补偿数据稀疏性。根据心理学理论,这种信息的丰富来源是用户的个性,如乐观和悲观,可以帮助确定她建立积极和消极联系的倾向。

在这项研究中,我们研究如何获得个性信息,以及个性信息是否有助于缓解符号链路预测的数据稀疏性问题。我们提出了一种新的符号链路预测模型,该模型能够通过社交媒体数据对用户个性进行实证探索我们在实际符号链路网络的两个数据集上评估我们提出的模型。结果证明了人格信息在符号链路预测问题中的互补作用。实验结果还表明了不同级别的人格信息对符号链接数据稀疏性问题的有效性。

用于用户身份链接的图神经网络

原文标题:

Graph Neural Networks for User Identity Linkage

地址:

http://arxiv.org/abs/1903.02174

作者:

Wen Zhang, Kai Shu, Huan Liu, Yalin Wang

摘要: 社交媒体网站的日益普及和多样化已经鼓励越来越多的人参与多个在线社会网络以享受他们的服务。每个用户可以创建用户身份以在每个社会网络中表示他或她的唯一公众人物。跨在线社会网络的用户身份链接是一项新兴任务,并且已经引起越来越多的关注,这可能潜在地影响各种领域,例如推荐和链路预测。

大多数现有工作侧重于挖掘网络邻近度或用户配置文件数据以发现用户身份链接。随着图神经网络( GNN )的最新进展,它提供了推进用户身份链接的巨大潜力,因为用户在社交图中连接,并且学习用户和项目的潜在因素是关键。但是,预测基于 GNN 的用户身份链接面临挑战。例如,用户社交图编码 local 结构(例如用户的邻域信号)和 global 结构(具有社区属性)。

为了同时解决这些挑战,在本文中,我们提出了一种用于用户身份链接的新型图神经网络框架( m)。特别是,我们提供了一种原则性的方法来共同捕获用户 – 用户社交图中的本地和全局信息,并提出框架 m,它共同学习用户身份链接的用户表示。对现实世界数据集的广泛实验证明了所提出框架的有效性。

文化模因的演化动力学及

其在大规模电影数据上的应用

原文标题:

Evolutionary Dynamics of Cultural Memes and Application to Massive Movie Data

地址:

http://arxiv.org/abs/1903.02197

作者:

Seungkyu Shin, Juyong Park

摘要: 达尔文演化论对生物学的深刻影响使得该理论在许多复杂系统中得到了接受,这些系统远远超出了其原始领域。文化是一个展示关键达尔文演化特性的例子:文化变体的差异化采用(变异和选择),模仿旧模式(继承)的新实体,以及向最合适的状态(适应)的趋同。

在这项工作中,我们提出了一个框架,用于捕捉文化系统中演化动力学的细节 – “模因” – 生物基因水平的文化类比,并分析大规模,全面的电影 – 模因关联数据,以构建时间表通过流派的演变和突出的子流派的兴衰来看电影史。我们还将有影响力的电影确定为流行的模因,我们可以说它们与人类众所周知的“夏娃”相对应,为某些类型的形成和发展过程提供了亮点。最后,我们衡量电影的影响如何与专家和公众的评估相关联。

交通网络中个体路

由随机性的全局益处

原文标题:

The global benefit of randomness in individual routing on transportation networks

地址:

http://arxiv.org/abs/1903.02392

作者:

Tak Shing Tai, Chi Ho Yeung

摘要: 通过引入基于二维元胞自动机的简单模型,我们揭示了单个车辆的路由策略与交通网络的全局行为之间的关系。具体来说,我们通过称为路径贪婪的单个参数来表征路由策略,这对应于个人通过最短路径前往目的地的趋势。值得注意的是,当车辆倾向于通过最短路径行驶时,在传统的自由流动状态和拥挤状态之间出现拥挤的流动状态,其中交通流量在拥挤的情况下随着车辆密度缓慢增加。

我们还发现,通过最短路径行进的高个人倾向并不一定会缩短平均行程时间,因为系统可能会在拥挤的情况下受益于不那么贪婪的路由策略。最后,我们表明自适应路由策略在自由流状态下优于受控策略,但不在拥挤状态,这意味着受控策略可以增加车辆之间的协调,有利于抑制交通拥堵。

多层网络中的结构保

留社区:定义、检测和分析

原文标题:

Structure-Preserving Community In A Multilayer Network: Definition, Detection, And Analysis

地址:

http://arxiv.org/abs/1903.02641

作者:

Abhishek Santra, Kanthi Sannappa Komar, Sanjukta Bhowmick, Sharma Chakravarthy

摘要: 多层网络或 MLN( 也称为多路复用或网络网络)被广泛用于具有多个实体和特征类型以及它们的关系的数据集的建模和分析。由于社区和中心的概念用于这些分析,因此在 MLN 上保留结构(保留原始 MLN 结构和节点/边标签和类型)及其有效检测的结构保持定义至关重要。由于大多数当前分析将 MLN 聚合为单个图,因此 MLN 的社区没有结构保留定义。

虽然单个图(和检测包)的社区定义已经达成共识,并且对于同质 MLN 在较小程度上存在共识,但缺乏异构 MLN。在本文中,我们不仅首次提供了结构保留定义,而且还提供了使用解耦方法的有效计算,并讨论了其特征和分析意义。所提出的效率解耦方法将来自各个层的社区组合成 MLN 中连接的k层的连续 k-社区。我们提出了几种权重度量,用于使用基于分析语义的二部图匹配方法组成分层社区。

我们提出的方法有许多优点。它:i)利用现存的单图社区检测算法,ii)基于广泛使用的最大流二部图匹配组成k层,iii)介绍了为社区概念定制的几个权重度量,以及 iv )实验验证从广泛使用的 IMDb 数据集的灵活分析角度定义,映射和效率。关键词:异构多层网络;二部图;社区定义和检测;基于解耦的组合

从嘈杂的流行病级联中学习图

原文标题:

Learning Graphs from Noisy Epidemic Cascades

地址:

http://arxiv.org/abs/1903.02650

作者:

Jessica Hoffmann, Constantine Caramanis

摘要: 我们通过观察该图上多个流行病级联的感染噪声时间来考虑学习图的加权边的问题。当级联信息(即感染时间)准确已知时,过去的工作已经考虑了这个问题。虽然嘈杂的环境很好地受到许多流行病过程(例如,大多数人类流行病)的驱动,但据我们所知,关于它何时可以解决的知之甚少。以前关于无噪声设置的工作批判性地使用了订购信息。

如果噪声可以逆转这一点 – 一个节点报告(嘈杂)的感染时间是在它感染的某个节点报告的感染时间之后 – 那么我们就无法看到以前的结果如何扩展。因此,我们处理了两种版本的噪声设置:有限噪声设置,我们知道感染的嘈杂时间,以及极端噪声设置,我们只知道节点是否被感染。我们提供了一种多项式时间算法,用于在极端噪声设置中恢复双向树的结构,并且表明我们的算法匹配在无噪声设置中建立的下界,因此是最优的。

我们扩展了一般度有界图的结果,我们再次证明了我们的(多时间)算法能够以最佳的样本复杂度恢复图的结构。我们还提供了第一种有效的算法来学习有限噪声设置中双向树的权重。最后,我们给出了一个多项式时间算法,用于学习有限噪声设置中一般有界度图的权重。该算法扩展到一般图(以指数运行时的代价),证明在一般情况下问题是可解的。我们所有的算法都适用于任何噪声分布,对方差没有任何限制。

Twitter发声:国

家灾难情境意识案例

原文标题:

Twitter Speaks: A Case of National Disaster Situational Awareness

地址:

http://arxiv.org/abs/1903.02706

作者:

Amir Karami, Vishal Shah, Reza Vaezi, Amit Bansal

摘要: 近年来,我们面临着一系列自然灾害,造成了巨大的财务,环境和人员损失。自然灾害行为的不可预测性使得很难有全面的态势感知( SA )来支持灾害管理。使用意见调查是分析自然灾害期间公众关注的传统方法;然而,这种方法有限,昂贵且耗时。

幸运的是,社交媒体的出现为学者提供了一种分析公众关注的替代方法。社交媒体使用户(人)能够自由地传达他们的意见并分散有关当前事件(包括自然灾害)的信息。这项研究强调社交媒体分析的价值,并提出了一个分析框架:Twitter 态势感知( TwiSA )。该框架使用文本挖掘方法,包括情感分析和主题建模,为灾难准备,响应和恢复创建更好的 SA 。 TwiSA 还有效地部署了大量的推文,并追踪2015年南卡罗来纳州洪水期间人们的负面担忧。

慷慨、自私和利用作为

资源共享的最佳贪婪策略

原文标题:

Generosity, selfishness and exploitation as optimal greedy strategies for resource sharing

地址:

http://arxiv.org/abs/1903.02786

作者:

Andrea Mazzolini, Antonio Celani

摘要: 越来越多的证据表明,公平和慷慨不是人类的独特特征。事实上,对黑猩猩,猴子和其他哺乳动物的几项实验表明存在不公平厌恶行为。即,如果有一些有价值的资源,例如食物,在两个人之间分配不均,获得较小份额的人可以拒绝奖励,并且在某些情况下,甚至可以尝试使用较大份额的动物来均衡分裂。因此,动物可以故意以明显的公平感降低其收益。

在这里,我们展示了受动物行为启发的资源收集和共享博弈中慷慨的出现。球员贪婪地行动,也就是说,他们试图单独最大化他们的个人收入。尽管如此,该模型的解析解表明,根据条件出现了三种最佳行为。除了玩家在选择资源分配方面自私的明显情况之外,还有一些条件下玩家都很慷慨。

此外,我们还发现了一系列情况,其中一个自私的玩家利用另一个慷慨的个体,以满足两个玩家的需求。我们的结果表明,不公平厌恶受到三个因素的青睐:玩家试图优化自己的博弈的长时间范围,玩家在执行资源收集任务的能力之间的相似性,以及环境中的资源。这些并发的要求导致了慷慨出现的必要条件。

旅行中心性:带有非瞬时

链路行进时间的含时多路游走

原文标题:

Trip Centrality: walking on a temporal multiplex with non-instantaneous link travel time

地址:

http://arxiv.org/abs/1903.02815

作者:

Silvia Zaoli, Piero Mazzarisi, Fabrizio Lillo

摘要: 在复杂网络中,中心度量标准量化节点的连通性并识别信号传输中最重要的节点。在许多现实世界网络中,尤其是在运输系统中,链路是动态的,即它们的存在取决于时间,并且在两个节点之间行进需要非消失时间。

另外,许多网络在若干层上构建,代表例如不同的运输模式或服务提供商。存在基于步行计数的中心度量的时间推广,如 Katz 中心性,但是它们不考虑非零链路传播时间和多路复用结构。我们提出卡茨中心性的概括,称为旅行中心性,仅计算根据网络时间结构可以行进的路径,即“行程”,同时还区分层间和层内行走对中心性的贡献。我们向美国航空运输系统展示了一个应用程序,特别是计算机场因飞行网络延误造成的中心性损失。

从Arxiv预测研究趋势

原文标题:

Predicting Research Trends From Arxiv

地址:

http://arxiv.org/abs/1903.02831

作者:

Steffen Eger, Chao Li, Florian Netzer, Iryna Gurevych

摘要: 我们对 Arxiv 论文的两个数据集进行趋势检测,这些数据集源自其机器学习( cs.LG )和自然语言处理( cs.CL )类别。我们的方法是自下而上:我们首先按照标准化的引文计数对论文进行排名,然后根据他们追求的任务和他们使用的方法将排名靠前的论文分组到不同的类别。然后我们分析这些结果主题。我们发现 cs.CL 中的主导范式围绕着自然语言生成问题而 cs.LG 中的主导范式围绕强化学习和对抗原则。通过推断,我们预测这些主题在短期和中期仍将是其领域的主要问题/方法。

丹麦、德国和荷兰的城市

尺度率,及其与治理结构的关系

原文标题:

Urban Scaling in Denmark, Germany, and the Netherlands. Relation with Governance Structures

地址:

http://arxiv.org/abs/1903.03004

作者:

Anthony F.J. van Raan

摘要: 我们调查丹麦,德国和荷兰的社会经济城市规模行为。就丹麦而言,我们研究了大城市,哥本哈根集聚区内的城市以及农村地区的城市规模。我们还区分具有高度和低度中心性的城市。在所有情况下都可以找到具有人口规模的城市总产品的超线性尺度,指数在1.14和1.24之间。

在德国,我们区分了周边城市地区属于城市的主要城市,以及由几个城市组成的小城市周边地区。在大多数情况下,我们发现超线性尺度,指数高达1.33。测量的尺度方程残差与用一组不同指标评估的城市的社会经济地位之间存在很强的关系。我们还研究了区域尺度和中心性之间的关系,包括 Zipf 分布。我们发现城市规模与生成过程有关,而与分配过程无关。对荷兰而言,我们专注于拥有聚集地的主要城市群以及 Zuid-Holland 省的所有城市。

我们研究了荷兰较大城市地区的城市规模。在所有情况下,使用高达1.28的指数来测量显著的超线性尺度。单治理城市地区的表现优于多治理城市地区。这导致了对一个市政当局的重要性的挑战性结论,而不是主要城市地区的多市政治。对主要城市及其聚集区的连贯治理可以创造更有效的社会互动,从而加强经济和文化活动,从而产生巨大的财富效益。

HEAT:属性网络的双曲嵌入

原文标题:

HEAT: Hyperbolic Embedding of Attributed Networks

地址:

http://arxiv.org/abs/1903.03036

作者:

David McDonald, Shan He

摘要: 寻找由网络描述的分层结构化数据的低维表示仍然是机器学习社区中的挑战性问题。一种新兴的方法是将这些网络嵌入到双曲空间中,因为它可以自然地表示网络的层次结构。但是,现有的双曲嵌入方法无法处理属性网络,其中节点使用其他属性进行注释。这些属性可能提供额外的邻近信息来约束节点的表示,这对于学习高质量双曲嵌入很重要。

为了填补这个空白,我们引入了 HEAT(属性网络的双曲嵌入),这是将属性网络嵌入双曲空间的第一种方法。 HEAT 由1)改进的随机游走算法组成,以获得捕获拓扑和属性相似性的训练样本; 2)用于从所获得的训练样本中学习双曲嵌入的学习算法。我们表明,通过利用节点属性, HEAT 可以在几个下游任务上胜过最先进的双曲嵌入算法。作为一种通用嵌入方法, HEAT 为各种属性和无属性网络上的双曲流形学习打开了大门。

来源:网络科学研究速递

编辑:孟婕

声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。

近期网络科学论文速递

多层网络可视化的现状 等12篇

维基百科数学家网络分析 等14篇

哪家银行最重要?看维基百科怎么说 等2篇

模拟交通网络和地区之间的相互作用 等5篇

复杂商业网络中的分层社区 等9篇

集体决策中的多样性与社会网络结构 等8篇

加入集智,一起复杂!


集智

集智俱乐部QQ群|877391004

商务合作及投稿转载|swarma@swarma.org

搜索公众号:集智俱乐部

加入“没有围墙的研究所”

集智

让苹果砸得更猛烈些吧!

原文始发于微信公众号(集智俱乐部):集智