集智

心速递

  • 网络科学预测全球初创企业成败;

  • 基于“消费者退税”欺诈的金字塔方案模型;

  • 原型城市水安全弹性动态;

  • 基于递归图神经网络的归纳图表示学习;

  • 将无标度特征与 Zipf 定律联系起来的合理证据;

  • 无标度网络模体的变分原理;

  • 通过编辑修订网络中的模体理解有争议的维基百科文章的签名;

  • 组合网络嵌入;

  • 新的密集子图发现初步尝试:风险规避和排除查询;

  • 在线种植:农业问答社区的问题路径选择;

  • 任意汽车跟随模型中车道变换动力学松弛现象的公式;

  • 系统比较在复杂网络中检测有影响力的传播者的方法;

  • 深度表征学习用于社会网络分析;

  • 一种快速有效的动态社区检测增量方法;

  • node2bits :用于用户拼接的紧凑的时间和属性感知节点表示;

  • 社会网络中失效的影响最大化;

  • 维基百科文章中的社会争议;

  • SEVA :电动汽车充电行为的数据驱动模型;

  • 多语言社会网络文本表征方案过滤言语攻击的实证评价;

  • 基于 Copula 的生成突发时间序列的算法;

  • 通过表征学习实现影响最大化;

网络科学预测全球初创企业成败

原文标题:

Predicting success in the worldwide start-up network

地址:

http://arxiv.org/abs/1904.08171

作者:

Moreno Bonaventura, Valerio Ciotti, Pietro Panzarasa, Silvia Liverani, Lucas Lacasa, Vito Latora

摘要:通过利用大规模在线数据,我们构建并分析了初创企业之间时变全球职业关系网络。该网络的节点代表公司,而链接模拟员工流动以及跨公司的相关技术转移。我们使用网络中心性措施在早期阶段评估初创企业长期积极表现的可能性,表明启动网络具有预测能力,并提供有价值的建议,使当前的技术水平达到一倍风险基金我们基于网络的方法不仅为风险投资公司的劳动密集型筛选流程提供了有效的替代方案,而且还使企业家和政策制定者能够对创新生态系统的长期潜力进行更客观的评估并实现目标相应的干预措施。

基于“消费者退税”欺

诈的金字塔方案模型

原文标题:

A Pyramid Scheme Model Based on “Consumer Rebate” Frauds

地址:

http://arxiv.org/abs/1904.08136

作者:

Yong Shi, Bo Li, Wen Long

摘要:有各种类型的金字塔计划给世界上许多人造成或正在造成损失。我们提出了一个金字塔方案模型,它具有近年来出现的许多金字塔计划的主要特征:有希望的高回报,奖励参与者招募下一代参与者,组织者将从他那里找到钱时拿走所有的钱。新参与者不足以支付以前参与者的兴趣和奖励。

我们假设金字塔方案分别在树形网络,ER 随机网络,SW 小世界网络或 BA 无标度网络中进行,然后给出金字塔方案在这些情况下可以持续多少代的分析结果。我们还使用我们的模型来分析现实世界中的金字塔方案,并且我们发现金字塔方案中的参与者之间的联系可以构成 SW 小世界网络。

原型城市水安全弹性动态

原文标题:

Resilience Dynamics of Urban Water Security in Archetype Cities

地址:

http://arxiv.org/abs/1904.07863

作者:

Elisabeth H. Krueger, Dietrich Borchardt, James W. Jawitz, Harald Klammler, Soohyun Yang, Jonatan Zischg, P. Suresh C. Rao

摘要:城市是社会经济创新的驱动力,也被迫解决当前和未来供水等基本服务失败的加速风险。在这项贡献中,我们调查了城市供水安全的复原力,这是根据公民获得的服务来定义的。服务的弹性取决于关键系统要素的可用性和稳健性,或“资本”(水资源,基础设施,财务,管理效能和社区适应)。我们将来自四大洲七个对比城市的资本组合的定量信息转换为耦合系统动力学模型的参数。

每个城市的供水服务都会因反复出现的随机冲击而中断,我们会模拟影响和恢复周期的动态。弹性在各种约束下出现,以每个城市的资本组合表示。对参数空间的系统评估产生了城市水弹性景观,我们确定每个城市沿着这个景观的连续梯度的位置。在一些城市,随机扰动机制挑战稳态条件并推动系统崩溃。

动态系统行为的比较确定了三个主要系统类别:1)水不安全和非弹性城市,这些城市有可能陷入贫困陷阱; 2)转型中的城市; 3)水安全和富有弹性的城市,其中一些城市已经出现了过剩的资本,并且有可能陷入僵化困境。在1)和2)社区适应显著提高了水安全性和恢复力。我们的研究结果为全球城市供水系统的未来管理潜力提供了见解。

基于递归图神经网

络的归纳图表示学习

原文标题:

Inductive Graph Representation Learning with Recurrent Graph Neural Networks

地址:

http://arxiv.org/abs/1904.08035

作者:

Binxuan Huang, Kathleen M. Carley

摘要:在本文中,我们研究了图神经网络的节点表示学习问题。我们提出了一个名为递归图神经网络(RGNN)的图神经网络类,它解决了现有方法的缺点。通过使用循环单元来捕获跨层的长期依赖性,我们的方法可以在递归邻域扩展期间成功识别重要信息。在我们的实验中,我们展示了我们的模型类在三个基准测试中实现了最先进的结果:Pubmed,Reddit 和 PPI 网络数据集。我们的深入分析还表明,结合循环单元是一种简单而有效的方法,可以防止图中的噪声信息,从而实现更深层的图神经网络。

将无标度特征与 Zipf 定

律联系起来的合理证据

原文标题:

A sensible proof connecting the scale-free feature with the Zipf-law

地址:

http://arxiv.org/abs/1904.08065

作者:

Fei Ma

摘要:自然界和社会中的大多数大型复杂系统可以很好地描述为复杂的网络(图),以更好地理解其背后的演化机制和动力学功能。某些部分遵循无标度行为,即,度数大于或等于 k 的顶点数的比率和整个网络的顺序服从表达式 P cum(k) sim k ^ 1- gamma ( 2 < gamma <3 )。同时,满足这个 f r sim r ^ – alpha ( alpha 接近统一)的 Zipf-law 在许多复杂系统中也很普遍,例如文本中的字频和城市规模。

可以很容易地注意到,上述两者具有相同类型的外观,即已知的幂律。与通过连续统理理论分析证明的无标度特征相比,到目前为止,后者在大多数情况下仍被认为是许多科学界的经验原则,特别是在社会科学中。由于这个原因,需要指出两者之间的内部连接或区分彼此的差异。

这里,对于任意给定的 N 无标度网络模型,我们报告了基于顶点排名的无标度特征和 Zipf 定律之间的等价关系。通过严格的数学推导,我们消除了缺口,缺乏 Zipf 定律的理论基础。因此可以确信,采用已经用于研究复杂网络的方法来制定 Zipf 定律是合理的。

无标度网络模体的变分原理

原文标题:

Variational principle for scale-free network motifs

地址:

http://arxiv.org/abs/1904.08114

作者:

Clara Stegehuis, Remco van der Hofstad, Johan S. H. van Leeuwaarden

摘要:对于具有度数遵循幂指数 tau in(2,3)的无标度网络,模体(小子图)的结构尚不清楚。我们引入了一种方法,用于识别任何给定模体的主导结构,作为优化问题的解决方案。唯一优化器描述了共同跨越最可能的主题的顶点的度数,从而导致主题计数及其波动的显式渐近公式。然后,我们将所有模体分为两类:具有小波动和大波动的模体。

通过编辑修订网络中的模体理

解有争议的维基百科文章的签名

原文标题:

Understanding the Signature of Controversial Wikipedia Articles through Motifs in Editor Revision Networks

地址:

http://arxiv.org/abs/1904.08139

作者:

James R. Ashford, Liam D. Turner, Roger M. Whitaker, Alun Preece, Diane Felmlee, Don Towsley

摘要:维基百科是编辑如何协作形成和维护文章的一个很好的例子。编辑器之间的关系源自其编辑活动序列,导致称为修订网络的有向网络结构,可能对编辑活动有宝贵的见解。在本文中,我们创建了修订网络,以评估有争议和无争议的文章之间的差异,如维基百科所标记的。源于复杂的网络,我们应用 motif 分析,它决定诱导子结构的不足或过度表示,在这种情况下是三元组的编辑。

我们用这种方式分析了21,631篇维基百科文章,并使用主成分分析来考虑它们的主题子图比率曲线之间的关系。结果表明,少数诱导三元组在表征编辑之间的关系中起着重要作用,有争议的文章具有聚类倾向。这为编辑行为和交互捕获反叙事提供了有用的见解,而无需借助语义分析。它还为将来预测有争议的维基百科文章提供了一个潜在有用的功能。

组合网络嵌入

原文标题:

Compositional Network Embedding

地址:

http://arxiv.org/abs/1904.08157

作者:

Tianshu Lyu, Fei Sun, Peng Jiang, Wenwu Ou

摘要:事实证明,网络嵌入在各种网络分析任务中非常有用,例如节点分类,链路预测和网络可视化。几乎所有现有的网络嵌入方法都学会将节点 ID 映射到它们对应的节点嵌入。然而,这种设计原则阻碍了现有方法在实际情况中的应用。节点 ID 不可推广,因此,现有方法必须在冷启动问题上付出巨大努力。异构网络通常需要额外的工作来编码节点类型,因为节点类型不能通过节点 ID 来识别。

节点 ID 携带稀有信息,导致批评现有方法对噪声不稳健。为了解决这个问题,我们引入了组合网络嵌入,这是一种通用的归纳网络表示学习框架,它通过基于组合原理组合节点特征来生成节点嵌入。我们不是直接优化基于任意节点 ID 的嵌入查找,而是学习组合函数,通过基于图的损失组合相应的节点属性嵌入来推断节点嵌入。为了评估,我们在四种不同的设置下进行链路预测的实验。结果验证了组合网络嵌入的有效性和泛化能力,特别是对看不见的节点。

新的密集子图发现初步

尝试:风险规避和排除查询

原文标题:

Novel Dense Subgraph Discovery Primitives: Risk Aversion and Exclusion Queries

地址:

http://arxiv.org/abs/1904.08178

作者:

Charalampos E. Tsourakakis, Tianyi Chen, Naonori Kakimura, Jakub Pachocki

摘要:在最密集的子图问题中,给定加权无向图 G(V,E,w),具有非负边权重,我们被要求找到节点 S subseteq V 的子集,其最大化度密度 w(S)/ | S | ,其中 w(S)是 S 引起的边权重之和。这个问题是一个研究得很好的问题,被称为 em emst subgraph problem,并且在多项式时间内是可解的。但是当边权重为负时会发生什么?这个问题在多项式时间内仍然可以解决吗?另外,为什么我们应该关注负重量下最密集的子图问题?在这项工作中,我们回答了上述问题。

具体来说,我们提供了两种适用于各种应用的新颖图挖掘初步尝试。我们的初步尝试可以用来回答诸如“如何在 Twitter 上找到一个密集的子图,有很多回复和提及但没有跟随?”的问题,“我们如何提取一个具有高预期回报和低风险的密集子图图”?我们在数学上将这两个问题都表述为具有负权重的图中的密集子图发现的特殊实例。我们研究问题的硬度,并且我们证明了问题通常是 NP 难的。

我们设计了一种有效的近似算法,该算法在小负权重的情况下运行良好,并且对于更一般的情况也是有效的启发式算法。最后,我们对各种现实世界的不确定图进行了实验,并对爬行的 Twitter 多层图进行了验证,验证了所提出的图元的价值,以及我们提出的算法的实用价值。代码和数据可在 url https://github.com/negativedsd上找到。

在线种植:农业问答

社区的问题路径选择

原文标题:

Cultivating Online: Question Routing in a Question and Answering Community for Agriculture

地址:

http://arxiv.org/abs/1904.08199

作者:

Xiaoxue Shen, Liyang Gu, Adele Lu Jia

摘要:现在,基于社区的问答(CQA)平台在十多亿拥有众包知识的人群中具有启发性。CQA 平台的一个关键设计问题是如何找到潜在的回答者,并提供及时和合适的答案,即所谓的 textit 问题路由问题。最先进的方法通常依赖于从问题文本中提取主题。在这项工作中,我们分析了名为 Farm-Doctor 的 CQA 系统中的问题路由问题,该系统专用于农业知识。主要挑战是其问题包含有限的文字信息。为此,我们进行了广泛的测量,并获得了 Farm-Doctor 的整个知识库,其中包含超过69万个问题和300多万个答案。

为了弥补文本缺陷,我们将 Farm-Doctor 建模为异构信息网络,其中包含丰富的辅助信息,并且基于网络表示学习模型,我们准确地为每个问题推荐极有可能回答它的用户。平均每天收入不到6美元,中国有超过30万农民在农场医生网上寻求农业建议。我们的方法可以帮助这些不那么雄辩的农民进行种植,并希望提供一种改善生活的方法。

任意汽车跟随模型中车道

变换动力学松弛现象的公式

原文标题:

A formulation of the relaxation phenomenon for lane changing dynamics in an arbitrary car following model

地址:

http://arxiv.org/abs/1904.08395

作者:

Ronan Keane, H. Oliver Gao

摘要:本文开发了一种车道变换动力学模型,可应用于任意车辆跟随模型。如果没有车道变换动力学,汽车跟随模型通常会产生不切实际的轨迹,因为它们对车道变换操作引起的空间车头时距变化的反应过于强烈。随着车道变换动力学的增加,汽车跟随模型避免了这些不切实际的行为,并在校准经验数据时实现更好的拟合。可以使用具有物理意义的单个参数来应用车道变换动态,并且可以描述多种类型的车道变换。使用NGSim轨迹数据和三种不同的汽车跟随模型进行验证。

系统比较在复杂网络中检

测有影响力的传播者的方法

原文标题:

Systematic comparison between methods for the detection of influential spreaders in complex networks

地址:

http://arxiv.org/abs/1904.08457

作者:

Sirag Erkol, Claudio Castellano, Filippo Radicchi

摘要:影响最大化是找到网络节点集合的问题,该节点集合最大化在网络上发生的扩散过程的爆发的大小。解决此问题对于营销和政治活动中的战略决策非常重要。典型设置包括识别非常大的网络中的小型初始传播者。此设置使得优化问题在计算上不可行,对于标准贪婪优化算法同时考虑有关网络拓扑和扩展动态的信息,仅基于依赖于网络几何的急剧近似的启发式方法留出空间。

关于该主题的文献是大量纯粹的拓扑方法,用于识别网络中有影响的传播者。但是,尚不清楚这些方法在多大程度上不是最佳的。在这里,我们对多种启发式方法的性能进行系统测试,以识别有影响的传播者。我们量化了100个真实网络语料库中各种方法的性能;语料库由足够小的网络组成,用于应用贪婪优化,因此该算法的结果被用作分析同一网络语料库中其他方法的性能所需的基线。我们发现,相对简单的网络指标,如自适应度或接近度中心,能够实现非常接近基线值的性能,从而为在大规模问题设置中使用这些指标提供了良好的支持……

深度表征学习用于社会网络分析

原文标题:

Deep Representation Learning for Social Network Analysis

地址:

http://arxiv.org/abs/1904.08547

作者:

Qiaoyu Tan, Ninghao Liu, Xia Hu

摘要:社会网络分析是数据挖掘中的一个重要问题。分析社会网络的基本步骤是将网络数据编码成低维表示,即网络嵌入,以便可以有效地保留网络拓扑结构和其他属性信息。网络表示倾向有助于进一步的应用,例如分类,链路预测,异常检测和聚类。此外,基于深度神经网络的技术在过去几年中引起了极大的兴趣。在本次调查中,我们利用神经网络模型对网络表示学习中的当前文献进行了全面的回顾。

首先,我们介绍了在同构网络中学习节点表示的基本模型。同时,我们还将介绍基础模型的一些扩展,以解决更复杂的场景,例如分析归因网络,异构网络和动态网络。然后,我们介绍嵌入子图的技术。之后,我们介绍了网络表示学习的应用。最后,我们讨论了未来工作的一些有希望的研究方向。

一种快速有效的动

态社区检测增量方法

原文标题:

A Fast and Efficient Incremental Approach toward Dynamic Community Detection

地址:

http://arxiv.org/abs/1904.08553

作者:

Neda Zarayeneh, Ananth Kalyanaraman

摘要:社区检测是网络科学家用来分析现实世界网络结构的发现工具。它旨在识别输入网络中可能存在的自然划分,这些划分将顶点划分为连贯的模块(或社区)。虽然这个问题空间丰富了高效的算法和软件,但大多数文献都适用于底层网络不会发生变化的静态用例。但是,许多新兴的实际用例导致需要将动态图表作为输入。在本文中,我们提出了一种快速有效的增量方法,用于动态社区检测。

关键贡献是一种名为 Delta-screening 的通用技术,它检查对输入图所做的最新一批更改,并选择一组顶点来重新评估潜在的社区(重新)分配。该技术可以结合到使用模块性作为聚类的目标函数的任何社区检测方法中。出于演示目的,我们将该技术整合到两个着名的社区检测工具中。我们的实验表明,我们的新增量方法能够在不影响输出质量的情况下产生性能加速(尽管具有启发式特性)。

例如,在具有 63M 时间边(超过12个时间步长)的真实世界网络上,我们的方法能够在1056秒内完成,比基线实现产生3倍的加速。除了展示性能优势之外,我们还展示了如何使用我们的方法来描述分析输入网络的时间分辨率的适当间隔。

node2bits:用于用户拼接的

紧凑的时间和属性感知节点表示

原文标题:

node2bits: Compact Time- and Attribute-aware Node Representations for User Stitching

地址:

http://arxiv.org/abs/1904.08572

作者:

Di Jin, Mark Heimann, Ryan Rossi, Danai Koutra

摘要:身份拼接是在现实世界的 Web 服务中向同一用户识别和匹配各种在线参考(例如,通过不同设备和时间跨度的会话)的任务,对于个性化和推荐是至关重要的。然而,传统的用户拼接方法,例如分组或阻塞,需要在大量用户活动之间进行二次成对比较,从而带来计算和存储挑战。最近的作品通常是针对特定应用的,启发式地寻求减少比较的数量,但是它们的精度和召回率都很低。

为了以与应用无关的方式解决问题,我们采用基于异构网络的方法,其中用户(节点)与内容(例如,会话,网站)交互,并且可以具有属性(例如,位置)。我们提出了 node2bits ,这是一个有效的框架,用于表示具有二进制哈希码的节点上下文的多维特征。

node2bits 利用基于特征的时间遍历来封装异构 Web 网络中节点之间的短期和长期交互,并采用 SimHash 来获得紧凑的二进制表示,并避免相似性搜索的二次复杂度。在大规模真实网络上进行的大量实验表明,node2bits 优于传统技术和现有工作,在用户拼接的 F1 得分中产生实值嵌入高达5.16%,而存储空间仅高达1.56%。

社会网络中失效的影响最大化

原文标题:

Influence Maximization With Deactivation In Social Networks

地址:

http://arxiv.org/abs/1904.08628

作者:

Kübra Tanınmış, Necati Aras, İ.K. Altınel

摘要:在本文中,我们考虑在社会网络中扩展众所周知的影响最大化问题,该社会网络处理寻找一组 k 个节点以启动扩散过程,以使得在过程结束时受影响的节点的总数最大化。该扩展侧重于竞争变体,其中涉及两个决策者。

第一个是领导者,他们试图通过选择最有影响力的节点来最大化影响力的传播,而第二个,即跟随者,试图通过停用其中一些节点来最小化它。通过小尺寸实例的完全枚举和大尺寸实例的数学解决方案来解决公式化的双层模型。在这两种情况下,作为随机优化问题的较低级问题通过样本平均近似方法来近似。

维基百科文章中的社会争议

原文标题:

Societal Controversies in Wikipedia Articles

地址:

http://arxiv.org/abs/1904.08721

作者:

Erik Borra, Andreas Kaltenbrunner (BMF), Michele Mauri, Esther Weltevrede, David Laniado, Richard Rogers (UvA), Paolo Ciuccarelli, Giovanni Magni, Tommaso Venturini (MEDIALAB, CIS)

摘要:协作内容创建不可避免地会遇到不同观点导致冲突的情况。我们专注于维基百科,这是任何人都可以编辑的免费百科全书,其中有争议文章内容的争议往往反映出更大的社会争论。虽然维基百科对每篇文章都有公共编辑历史和讨论部分,但对于对文章开发感兴趣的维基百科用户以及查找哪些主题最具争议性,这些部分的内容很难实现。

在本文中,我们介绍了 Contropedia ,这是一个增加维基百科文章的工具,可以深入了解有争议话题的发展。Contropedia 使用基于编辑历史的高效语言无关测量,该编辑历史专注于维基链接,以便轻松识别维基百科文章中哪些主题最具争议性以及何时出现。

SEVA:电动汽车充

电行为的数据驱动模型

原文标题:

SEVA: A Data driven model of Electric Vehicle Charging Behavior

地址:

http://arxiv.org/abs/1904.08748

作者:

Jurjen R. Helmus, Seyla Wachlin, Igna Vermeulen, Mike H. Lees

摘要:目前,世界各国政府和城市正面临电动汽车使用的快速增长,因此需要充电基础设施。对于这些城市而言,在成本和使用方面,仍然需要以最有效的方式进一步推广充电基础设施。预测模型无法预测更多的长期发展,因此更复杂的模拟模型提供了模拟各种情景的机会。

基于主体的仿真模型可以在激励和推出策略实施之前深入了解激励和推出策略的效果,从而允许进行情景测试。本文描述了基于主体的模型的构建,使政策制定者能够预测充电基础设施的发展。该模型能够模拟单个用户的计费交易,并使用来自荷兰四大城市的公共计费基础设施的计费交易数据集进行校准和验证。

多语言社会网络文本表征

方案过滤言语攻击的实证评价

原文标题:

An Empirical Evaluation of Text Representation Schemes on Multilingual Social Web to Filter the Textual Aggression

地址:

http://arxiv.org/abs/1904.08770

作者:

Sandip Modha, Prasenjit Majumder

摘要:本文试图从社交媒体内容的角度研究文本表示方案对两个任务的有效性:用户攻击和事实检测。在用户攻击检测中,目的是从社交媒体中生成的内容中识别侵略程度,并用英语,梵文印地语和罗马化印地语书写。攻击等级分为三个预定义的类别:“非攻击性”,“过度攻击性”和“隐蔽攻击性”。在灾难相关事件中,像 Twitter 这样的社交媒体充斥着数以百万计的帖子。在这种紧急情况下,确定事实职位对参与救济行动的组织很重要。我们将此问题视为分类和排名问题的组合。本文介绍了基于 BoW 技术,分布式词/句子表示,分类器转移学习的各种文本表示方案的比较。加权 F_1 得分用作主要评估指标。

结果表明,使用 BoW 的文本表示比机器学习分类器上的字嵌入更好。虽然预先训练的 Word 嵌入技术在基于深度神经网络的分类器上表现更好。最近的转移学习模型,如 ELMO,ULMFiT,针对侵略分类任务进行了微调。但是,结果与预训练的单词嵌入模型不同。总的来说,使用 fastText 的单词嵌入产生的最佳加权 F_1 -score 比 Word2Vec 和 Glove 。使用预训练的矢量模型进一步改善结果。采用统计显著性检验来确保分类结果的重要性。在词汇不同的测试数据集的情况下,除了训练数据集之外,深度神经模型比机器学习分类器更稳健并且表现更好。

基于 Copula 的生成

突发时间序列的算法

原文标题:

Copula-based algorithm for generating bursty time series

地址:

http://arxiv.org/abs/1904.08795

作者:

Hang-Hyun Jo, Byoung-Hwa Lee, Takayuki Hiraoka, Woo-Sung Jung

摘要:各种自然和社会现象中的动态过程已经通过显示非泊松,突发时间模式的一系列事件或事件序列来描述。这种突发时间序列中的时间相关性不仅可以通过异构的时间间隔(IET)来理解,而且可以通过 IET 之间的相关性来理解。建模和模拟各种动态过程需要我们在 IET 之间生成具有重尾 IET 分布和记忆效应的事件序列。

为此,我们提出了一种基于 Farlie-Gumbel-Morgenstern copula 的算法,用于在给出 IET 分布和两个连续 IET 之间的存储系数时,生成具有相关 IET 的事件序列。我们成功地将我们的算法应用于具有重尾 IET 分布的情况。我们还将我们的算法与现有的混洗方法进行比较,发现我们的算法在某些情况下优于混洗方法。我们的基于 copula 的算法有望用于各种动态过程的更真实的建模。

通过表征学习实现影响最大化

原文标题:

Influence Maximization via Representation Learning

地址:

http://arxiv.org/abs/1904.08804

作者:

George Panagopoulos, Michalis Vazirgiannis, Fragkiskos D. Malliaros

摘要:尽管过去已经广泛研究了影响最大化,但大多数工作都集中在问题的算法方面,忽略了可以通过数据驱动的观察或包含机器学习得出的几个实际改进。主要挑战一方面在于限制可扩展性的算法解决方案的计算需求,另一方面在于预测影响扩散的质量。

在这项工作中,我们提出了IMINFECTOR(影响最大化与INFluencer vECTORs),一种渴望使用表示学习来解决这两个问题的方法。它由两部分组成。第一种是基于多任务神经网络,该网络使用扩散级联的日志来嵌入节点之间的扩散概率以及节点创建大规模级联的能力。第二部分使用扩散概率将影响最大化重新形成为加权的二分匹配问题,并利用学习的表示来使用贪婪的启发式方法找到种子集。我们将这种方法应用于伴随扩散级联的三个相当大的网络中,并使用未来时间步骤中看不见的扩散级联来评估它。我们观察到,我们的方法在预测精度和种子集质量方面优于影响最大化的多样化景观中的各种竞争算法和度量。

来源:网络科学研究速递

编辑:孟婕

声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。

近期网络科学论文速递

分析网络数据的9个快速技巧 等23篇

如何表征人工蜂群算法中社会交互 等17篇

人类社会演化的动力学:一种能量学方法 等12篇

提高推荐系统长期性能的新方法 等16篇

使用深度神经网络对 Twitter进行威胁检测 等16篇

加入集智,一起复杂!


集智

集智俱乐部QQ群|877391004

商务合作及投稿转载|swarma@swarma.org

搜索公众号:集智俱乐部

加入“没有围墙的研究所”

集智

让苹果砸得更猛烈些吧!

原文始发于微信公众号(集智俱乐部):集智