使用Chung-Lu随机图模型生成大规模无标度网络 | 网络科学论文速递20篇-集智俱乐部

核心速递

  • 基于Chung-Lu随机图模型生成大规模无标度网络
  • 相互依赖的不对称性使得多层系统对连锁故障更具鲁棒性
  • 弱社会监督下的虚假新闻检测
  • 时间网络上的流行病阈值预测:综述和开放性问题
  • 改进新闻推荐中快速准确的知识文档表示
  • 网络中的节点相似性度量
  • 在网络社区检测中基于随机游走的贝叶斯建模
  • 社会博弈网络综述
  • 逆强化学习阐释YouTube的发表评论行为
  • 使用高分辨率的网络数据进行贝叶斯流行病学建模
  • 使用递归神经网络建模车辆移动模式
  • 使用个性化的PageRank进行海量模型图的定向取样
  • 层级位置神经网络预测Twitter的用户地理位置
  • 通过选择领导者改变社会网络观点
  • 自适应目标利润最大化的高效逼近算法
  • 符号网络的双曲节点嵌入
  • 基于用户中心性分析的住宅位置估计
  • 超密集双体欧氏匹配网络中 SIR 的元分布
  • 基于属性选择的实时竞价策略优化
  • 比特币交易图中的黑客子网分析

基于Chung-Lu随机图

模型生成大规模无标度网络

原文标题:
Generating large scale-free networks with the Chung-Lu random graph model
地址:
http://arxiv.org/abs/1910.11341
作者:
Dario Fasino, Arianna Tonetto, Francesco Tudisco
摘要:通过生成随机图模型和可伸缩算法生成综合网络是网络分析中的一个经常性使用的工具,它为实际网络中各种属性的统计分析提供了一个有根据的基础。本文用Chung-Lu模型说明了如何生成具有幂律分布的大型随机图特别是,我们关注的是一个必须放在模型参数上的基本假设的实现,如果没有这个假设,生成的图就会失去模型的所有理论属性,特别是,期望节点度的可控性以及由边连接的两个节点的度之间不存在相关性。我们提供了模型参数的显式公式,以便生成满足对最小、最大和平均期望度的行为的若干要求,并且具有若干期望特性的随机图,包括具有任意指定指数大于2的幂律度分布,存在一个巨大的组件并且没有潜在的孤立节点。

相互依赖的不对称性使得

多层系统对连锁故障更具鲁棒性

原文标题:
Asymmetry in interdependence makes a multilayer system more robust against cascading failures
地址:
http://arxiv.org/abs/1910.11417
作者:
Run-Ran Liu, Chun-Xiao Jia, Ying-Cheng Lai
摘要:多层网络系统在自然界和工程中都是普遍存在的,而这些系统对故障的鲁棒性是研究的热点。理论研究的一条主线是由渗流引起的级联故障,其中网络层之间的相互依赖被方便地默认为对称的。在现实世界中,相互依存的相互作用通常是不对称的。为了揭示和量化相互依赖的非对称性对网络鲁棒性的影响,我们重点研究了双层系统中的渗流动力学,并实施以下破坏机制:一旦网络层中的节点失效,它可能造成的损害不仅取决于它在层中的位置,而且还取决于它在另一层中的对应邻居的位置。我们发现,渗流转变的特征取决于不对称程度,在不对称程度下,从一阶到二阶相变的性质出现了明显的转变现象。在综合网络和经验网络的强大数值支持下,我们导出了一个理论来计算两个网络层中渗流过渡点和过渡切换点。我们的工作不仅揭示了决定多层网络抗级联故障的稳健性的因素,而且还提供了一个场景,通过该场景,可以设计或控制系统,以达到理想的弹性水平。

弱社会监督下的虚假新闻检测

原文标题:
Detecting Fake News with Weak Social Supervision
地址:
http://arxiv.org/abs/1910.11430
作者:
Kai Shu, Ahmed Hassan Awadallah, Susan Dumais, Huan Liu
摘要:有限的标注数据正成为有监督学习系统的最大瓶颈。许多实际任务尤其如此,在这些任务中,由于隐私或数据访问限制,大规模的带注释示例要么获取成本太高,要么不可用。弱监督已被证明是一种通过利用弱标签、启发式规则和外部知识源注入约束来缓解标注数据稀缺性的好方法。在本文中,我们将说明如何利用社交媒体的各个方面来产生弱社会监督。具体来说,我们以最近关于虚假新闻检测的研究为例,来说明在面对小标签数据问题时,弱社会监督是有效的。这篇文章为在弱社会监督的情况下学习其他新出现的任务打开了大门。

时间网络上的流行病阈值

预测:综述和开放性问题

原文标题:
Toward epidemic thresholds on temporal networks: a review and open questions
地址:
http://arxiv.org/abs/1910.11474
作者:
Jack Leitch, Kathleen A. Alexander, Srijan Sengupta
摘要:流行病学接触网络模型已经成为了解和预测传染病传播的重要工具,因为它们具有参与个体异质性的能力,而个体异质性可能是特定宿主-病原体系统基本动力学的基础。同样重要的是,随着时间的推移,真实世界的网络会发生变化,这些变化独立于病原体的传播,并对其作出反应。这些动力学在决定一种疾病在一个被称为流行病阈值的人群中是会消亡还是会流行方面起着中心作用。本文综述了时间网络模型的流行阈值预测方法,并讨论了尚待研究的领域。

改进新闻推荐中快速

准确的知识文档表示

原文标题:

Fast and Accurate Knowledge-Aware Document Representation Enhancement for News Recommendations
地址:
http://arxiv.org/abs/1910.11494
作者:
Danyang Liu, Jianxun Lian, Ying Qiao, Jiun-Hung Chen, Guangzhong Sun, Xing Xie
摘要:知识图包含结构化良好的外部信息,对推荐系统具有一定的实用价值。现有的大多数知识方法都假定将项目推荐系统与知识图中的实体联系起来,通过推荐系统和知识的联合建模,可以更好地学习项目嵌入。然而,这不是新闻推荐的情况,即新闻文章实际上与知识实体集合有关。一篇文章中实体的重要性得分和语义信息是相互区别的,这取决于文章的主题和共现实体之间的关系。如何充分利用这些实体来提供更好的新闻推荐服务是非常重要的。本文提出了一种快速有效的知识感知表示模型,用于提高新闻文档的理解能力。该模型由三层组成:(1)实体表示层;(2)上下文嵌入层;(3)信息提取层。实体由其自身及其周围实体的嵌入来表示。上下文嵌入层用于区分频率、类别和位置等不同实体的动态上下文。信息提取层将在原始文档向量的指导下对实体嵌入进行聚合,将文档向量转化为新的文档向量,并在真实的新闻阅读数据集上进行了大量的实验。结果表明,该模型对个性化新闻推荐、文章类别分类、文章流行度预测和本地新闻检测等多种新闻推荐任务都有很大的帮助。

网络中的节点相似性度量

原文标题:
Manipulating Node Similarity Measures in Network
地址:
http://arxiv.org/abs/1910.11529
作者:
Palash Dey, Sourav Medya
摘要:节点相似性度量量化一对节点在网络中的相似程度。这些相似性度量是许多实际应用(如网络中的链路预测、推荐系统等)的重要基础工具,其中一类重要的相似性度量是局部相似性度量。如果两个节点的相邻节点集之间有很大的重叠,则在局部相似度量下,它们被认为是相似的。通过去除边缘来操作节点相似性度量是一个重要的问题。例如,这种操纵会妨碍恐怖分子网络中链路预测的有效性。幸运的是,所有围绕操作相似性度量的流行计算问题的计算复杂度都是NP-hard的。本文通过参数化复杂度方法,得到了这些问题细粒度的复杂结果。特别地,我们证明了这些问题中的一些自然参数是固定参数可解的(FPT),而其他问题仍然是难以处理的(特别是W[1]-hard和W[2]-hard)。最后,我们证明了FPT算法应用于真实数据网络以及BA模型和ER模型生成的合成网络的有效性。

在网络社区检测中

基于随机游走的贝叶斯建模

原文标题:
Bayesian Modeling of Random Walker for Community Detection in Networks
地址:
http://arxiv.org/abs/1910.11587
作者:
Takafumi J. Suzuki
摘要:本文提出了一种基于随机游走检测网络中全局最优群体结构的生成模型。为了克服EM算法的局限性,在蒙特卡洛方法的基础上,提出了一种复杂的参数优化算法,该算法在以往的研究中已经得到了应用,但有时会因初始条件的不同而陷入局部最优。我们将这些算法应用到生成网络和真实网络中,以检验它们在被检测群体的精度和鲁棒性方面的性能。结果表明,Gibbs采样方法在检测重叠群落方面优于以往的方法。随机游走者的马尔可夫动力学对稳健地检测最优群落结构至关重要。

社会博弈网络综述

原文标题:
Building social networks under consent: A survey
地址:
http://arxiv.org/abs/1910.11693
作者:
Robert P. Gilles
摘要:本研究旨在探讨在连结形成的相互同意假设下网络形成博弈模型的文献。在链路形成中引入同意假设,给网络形成过程带来了一个协调问题。这项调查探讨了基于这一理论得出的结论和各种避免主要缺陷的方法。其主要见解来源于迈尔森关于链路形成中相互同意的研究,他的主要结论是,在任何相互同意和正链路形成成本下的网络博弈论模型中,空网络(没有任何链路的网络)总是以强纳什均衡的形式出现。Jackson和Wolinsky提出了一个合作框架,来避免这个主要的陷阱。他们提出了成对稳定网络的概念,以达到主要是非平凡的平衡网络。不幸的是,这种成对稳定的概念需要成对决策者在链路形成过程中采取协调行动。我通过探索标准纳什均衡概念的潜在改进来解释非平凡网络的出现,在一个完全非合作的网络形成框架下,在相互同意的情况下,调查可能的解决方案,并包括单边稳定和一元稳定的概念。第一个是建立在个人的高度理性推理的基础上,关于其他人会如何回应一个人修改网络的努力。后者将信任、有限度的理性行为纳入网络形成过程。该调查的结论是对外部相关设备作为解决网络形成中的相互同意的替代框架的初步探索。

逆强化学习阐释

YouTube的发表评论行为

原文标题:
Rationally Inattentive Inverse Reinforcement Learning Explains YouTube Commenting Behavior
地址:
http://arxiv.org/abs/1910.11703
作者:
William Hoiles, Vikram Krishnamurthy, Kunal Pattanayak
摘要:我们考虑了逆强化学习的一个新应用,它包括建模、学习和预测YouTube观众的评论行为。每一组用户都被建模为一个理性的贝叶斯主体。我们的方法集成了三个关键组件。首先,为了识别不同的评论模式,我们使用深度嵌入聚类来估计框架信息(重要的外部特征),这些信息将用户分为不同的组。第二,我们提出了一种逆强化学习算法,它使用贝叶斯显示偏好来检验合理性:是否存在一个效用函数使给定数据合理化,如果是的话,它可以用来预测未来的行为吗?为了刻画用户群体的注意力广度,我们引入了行为经济学中的理性不注意约束。测试提出了一个互信息成本约束,它影响主体如何选择注意策略来最大化期望效用。经过对大量YouTube数据集的仔细分析,令人惊讶的结果是,在大多数YouTube用户组中,评论行为与优化带有理性疏忽约束的贝叶斯实用程序是一致的。本文还强调了理性不注意模型如何准确预测未来的评论行为。本文中使用的大量YouTube数据集和分析可在GitHub上获得,并且是完全可重复的。

使用高分辨率的网络

数据进行贝叶斯流行病学建模

原文标题:
Bayesian epidemiological modeling over high-resolution network data
地址:
http://arxiv.org/abs/1910.11720
作者:
Stefan Engblom, Robin Eriksson, Stefan Widgren
摘要:数学流行病学模型有广泛的用途,包括定性和定量应用。随着数据的不断增加,已经可以建立大规模的定量疾病传播模型。这些模型具有很大的潜力,例如,在公共卫生风险评估方面。它们的主要挑战是基于监测数据的模型参数化,这一问题往往限制了它们的实际应用。我们提出了一个解决方案,通过发展贝叶斯方法适用于流行病学模型驱动的网络数据。获得集中后验参数的最大困难是监测数据的质量;疾病的测量通常很少,而且很少有关于参数的信息。因此,模型的可识别性这一经常被忽视的问题需要被解决,我们使用了一个层次结构来解决这个问题,这个层次结构是一个越来越现实的已知的真实实验。我们提出的贝叶斯方法在所有的综合测试中都有令人信服的表现。通过对瑞典牛产志贺毒素大肠杆菌0157的病原学测量,我们可以得到一个与数据相符的第一性原理的精确统计模型。在这个模型中,我们通过评估疾病检测和干预场景的效率来探索贝叶斯公共卫生框架的潜力。

使用递归神经网络建模车辆移动模式

原文标题:
Modeling vehicular mobility patterns using recurrent neural networks
地址:
http://arxiv.org/abs/1910.11851
作者:
Kevin O’Keeffe, Paolo Santi, Carlo Ratti
摘要:车辆移动模式的数据在许多情况下被证明是有用的。然而,能够准确地再现这些移动模式的生成模型却很少。在这里,我们探讨了递归神经网络能否解决这一问题。通过训练纽约和上海的出租车网络,以及密歇根的私家车网络,我们展示了移动模式的大部分方面都是可以复制的。特别是,递归神经网络能很好地捕捉街道使用的空间分布,这是其他模型难以做到的。

使用个性化的PageRank

进行海量模型图的定向取样

原文标题:
Targeted sampling from massive Blockmodel graphs with personalized PageRank
地址:
http://arxiv.org/abs/1910.12937
作者:
Fan Chen, Yini Zhang, Karl Rohe
摘要:本文提供了个性化PageRank (PPR)的统计理论和直觉,这是一种流行的技术,它从一个巨大的网络中抽取一个小的社区样本。我们研究的环境是难以获得或维护的整个网络。但是,我们可以从感兴趣的种子节点开始游走,通过它们的连接网络来查找其他节点。通过设计特定的游走方式,PPR载体可以在不查询整个大规模图的情况下,替代度校正随机块模型进行滚雪球抽样。我们进一步研究了PPR矢量是否可以选择属于同一个块的节点作为种子节点。我们用Twitter中大量的朋友网络说明了这个方法的有效性,我们使用Twitter API来抓取这个网络。我们发现(i)调整和未调整的PPR技术是互补的方法,其中调整使结果特别局限在种子节点周围,(ii)偏差调整从度正则化中获益良多。

层级位置神经网络预测

Twitter的用户地理位置

原文标题:
A Hierarchical Location Prediction Neural Network for Twitter User Geolocation
地址:
http://arxiv.org/abs/1910.12941
作者:
Binxuan Huang, Kathleen M. Carley
摘要:准确的用户位置估计对于许多在线服务来说是非常重要的。 以往的基于神经网络的方法大多忽略了位置之间的层次结构。 本文提出了一种基于层次结构的 Twitter 用户地理位置预测神经网络。 我们的模型首先为用户预测国家,然后用国家的结果来指导城市水平预测。 此外,我们还采用了一个字符感知字嵌入层来克服 推文中的噪声信息。 通过特征融合层,我们的模型可以适应不同的特征组合,并在不同的特征设置下实现三个常用基准的最新结果。 该方法不仅提高了预测精度,而且大大缩短了平均误差距离。

通过选择领导者改变社会网络观点

原文标题:
Shifting Opinions in a Social Network Through Leader Selection
地址:
http://arxiv.org/abs/1910.13009
作者:
Yuhao Yi, Timothy Castiglia, Stacy Patterson
摘要:本文研究了在一个社会网络中的French-Degroot观点动力学。 我们考虑一个网络,其中一个政党的领导人是给定的,我们提出的问题,选择领导集合的对立党派,以便转移平均观点到一个期望的价值。 这个问题推广了人们对影响最大化问题研究得比较深入的结论。 当每个政党只有一个领导人的时候,我们会用网络的拉普拉斯矩阵来表达一般的意见。 分析表明两个领导节点之间的影响力是平衡的。我们发现,选择最多 k 个完全固执的领导者来改变平均观点的问题是 np-hard的。 然后,将问题简化为带有子模背包约束和附加基数约束的子模最大化问题,并提出了一种上界搜索的贪婪算法来逼近最优解。 并在随机网络和真实网络中进行了实验,验证了该算法的有效性。

自适应目标利润

最大化的高效逼近算法

原文标题
Efficient Approximation Algorithms for Adaptive Target Profit Maximization
地址:
http://arxiv.org/abs/1910.13073
作者:
Keke Huang, Jing Tang, Xiaokui Xiao, Aixin Sun, Andrew Lim
摘要:给定一个社会网络G,利润最大化问题要求一组种子节点来实现利润最大化,即影响力收益的传播减去种子选择的成本。 目标利润最大化(TPM)问题是利润最大化(PM)问题的推广,目标是从目标用户集 T中选择种子节点子集,以实现利润最大化。 现有的 PM 算法大多考虑非自适应设置,即所有种子节点在一批中被选中,而不知道它们如何影响其他用户。 本文研究了自适应设置下的 TPM 问题,在自适应设置下,通过多批次选择种子用户,利用前批次中实际影响的知识进行批次选择。 为了全面了解这一问题,我们研究了在预言模型和噪声模型下的自适应 TPM 问题,分别提出了 ADG 和 AddATP 算法,并给出了较强的理论保证。 此外,为了更好地处理噪声模型下的采样误差,我们提出了基于混合误差的思想,在此基础上设计了一种新的算法 HATP,大大提高了 AddATP 的效率。 我们在真实的社交网络上进行了大量的实验来评估性能,实验结果强有力地证实了我们的解决方案的优越性和有效性。

符号网络的双曲节点嵌入

原文标题:
Hyperbolic Node Embedding for Signed Networks
地址:
http://arxiv.org/abs/1910.13090
作者:
Wenzhuo Song, Shengsheng Wang
摘要:快速发展的万维网产生了大量复杂的异质网络数据。 为了方便网络分析算法,有符号网络嵌入方法自动学习有符号网络中节点的特征向量。 然而,现有的算法仅仅设法将网络嵌入到欧几里德空间中,尽管许多已报道的有符号网络的特征更适合于非欧几里德空间。 此外,以往的工作也没有考虑到在现实世界中广泛存在的网络分层组织。 在这项工作中,我们研究了双曲空间网络是否是一个更好的选择来表示签名网络的问题。 本文提出了一种基于结构平衡理论和黎曼优化的非欧氏符号网络嵌入方法。 我们的方法把符号网络嵌入到一个庞加莱球中,这是一个双曲空间,可以看作是一棵连续的树。 这个特性使我们能够在有符号的网络中捕获底层的层次结构。 我们在六个真实世界的数据集上将我们的方法与三个基于欧几里德的基线在可视化、符号预测和重建任务上进行了实验性的比较。 实验结果表明,双曲嵌入算法比欧氏嵌入算法具有更好的嵌入效果,能够从符号网络中提取出有意义的潜在层次结构。

基于用户中心性分析的住宅位置估计

原文标题:
User’s Centrality Analysis for Home Location Estimation
地址:
http://arxiv.org/abs/1910.13195
作者:
Shiori Hironaka, Mitsuo Yoshida, Kyoji Umemura
摘要:用户属性,比如家庭位置,对许多应用程序都很有用。 许多研究人员一直在研究如何利用用户之间的关系来估计用户的家庭位置。 众所周知,某些用户的家庭位置,如名人,很难用关系来估计。 然而,由于估计所有名人的家庭位置实际上并不困难,所以弄清楚那些家庭位置难以估计的用户的特征很重要。 我们分析了代表用户特征的中心性,以及与朋友拥有相同的家庭位置的倾向是否相关。 结果表明,PageRank 和 HITS 得分与用户是否与朋友有相同的家庭位置有关,HITS 得分较高的用户与朋友有相同的家庭位置的频率较低。 这个结果表明,有两类用户的家庭位置是难以估计的:枢纽用户(关注许多名人)和权威用户(名人)。

超密集双体欧氏匹配

网络中 SIR 的元分布

原文标题:
Meta Distribution of SIR in Ultra-Dense Networks with Bipartite Euclidean Matchings
地址:
http://arxiv.org/abs/1910.13216
作者:
Alexander P. Kartun-Giles, Konstantinos Koufos, Sunwoo Kim
摘要:超密集网络通过空间重用将空间频谱效率最大化。 他们的稠密极限方法在数学上很难理解,因为欧几里德组合理论,尽管很容易描述,但是通常很难处理,而且经常涉及到一个随机模型。 这些模型定义方式的细微变化可以使它们预测的定性特性产生重大差异,例如关于信息共享的元分布、数据容量或者它们的效率。 本文主要研究欧氏空间中的三角形相关性和可变链路距离,并讨论了在更多的初等模型中引入的关键假设。

基于属性选择的实时竞价策略优化

原文标题:
Real-time Bidding campaigns optimization using attribute selection
地址:
http://arxiv.org/abs/1910.13292
作者:
Luis Miralles, M. Atif Qureshi, Brian Mac Namee
摘要:实时竞价是目前在线广告生态系统中最有前途的系统之一。 在这项研究中,通过优化用户个人资料和出版商网站的参数,RTB 广告活动的性能得到了提高。 大多数关于优化 RTB 广告活动的研究都集中在投标策略上。 相比之下,我们研究的目标是通过寻找最大化展示次数和平均利润的配置来优化 RTB 广告活动。 实验表明,当广告商所需的访问次数较低时,很容易找到平均盈利能力较高的配置,但随着所需访问次数的增加,平均盈利能力往往下降。 此外,配置优化已结合其他有趣的战略,以增加,甚至更多,活动的盈利能力。 除了参数配置之外,研究还考虑了以下增加盈利能力的补充战略: i)选择访问次数少的多种配置,而不是具有大量访问次数的独特配置; ii)根据成本和盈利能力的阈值放弃访问; iii)分析数据集的缩小空间并推断解决方案; iv)通过将解决方案包括在所需访问次数之下来增加搜索空间。 RTB平台可以向广告商提供开发的广告优化方法,以使他们的广告更有利可图。

比特币交易图中的黑客子网分析

原文标题:
Analyzing Hack Subnetworks in the Bitcoin Transaction Graph
地址:
http://arxiv.org/abs/1910.13415
作者:
Daniel Goldsmith, Kim Grauer, Yonah Shmalo
摘要:黑客行为是与加密货币相关的最具破坏性的犯罪之一,自2009年以来,盗取了数十亿美元的资金。 Chainalysis 的专业调查人员已经追踪到这些被盗资金,从交易所最初的入侵追踪到离线服务,即犯罪分子能够将被盗资金转换成法定货币或其它加密货币的服务。 我们分析了六个比特币交易的黑客子网络,它们属于两个著名的黑客组织。 我们根据网络的静态和动态特征对每个黑客进行分析,并通过我们新提出的方法成功地将每个黑客分类到各自的黑客组中。研究发现,静态特性,如节点平衡,入度,出度,并不是有用的指标。我们验证了我们的操作假设,即两个黑客组之间的关键区别是资金通过子网络中的终端节点加速流出。

来源:网络科学研究速递

审校:赵子鸣

编辑:张爽

声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。

近期网络科学论文速递

利用网络科学量化区域投入产出网络的经济扰动 | 网络科学论文速递25篇
Network2Vec基于网络空间映射学习节点表示 | 网络科学论文速递25篇
数字民主:公共软件公司可以如何改变政府与公民社会数字参与 | 网络科学论文速递24篇
学生社会网络研究综述 | 网络科学论文速递29篇
引用网络中心性:科学奖项的预测指标?| 网络科学论文速递24篇
通过守旧者、叛逆者和墙头草产生的两种意见动力学 | 网络科学论文速递21篇
加入集智,一起复杂!


使用Chung-Lu随机图模型生成大规模无标度网络 | 网络科学论文速递20篇-集智俱乐部

集智俱乐部QQ群|877391004

商务合作及投稿转载|swarma@swarma.org

搜索公众号:集智俱乐部

加入“没有围墙的研究所”

使用Chung-Lu随机图模型生成大规模无标度网络 | 网络科学论文速递20篇-集智俱乐部

让苹果砸得更猛烈些吧!

原文始发于微信公众号(集智俱乐部):集智