核心速递

维基百科数学家网络分析;
定量分区模型和本福德定律;
用于社会推荐的图神经网络;
具有不完美复制的多状态投票模型;
无标度相互依赖网络中的级联故障;
在线社会网络中赎回最大化的种子选择和社会优惠券分配;
投票给我！任意评分规则表决系统中社会影响的选举控制;
如果投资者的信念倾向于预测未来强势的气候政策，那么撤资可能会刺破碳泡沫;
NAIRS：神经注意力可解释推荐系统;
社交媒体上的虚假新闻：一项数据驱动的综述;
基于机器学习的现实手机数据鲁棒预测模型;
非马尔可夫恢复对网络上可逆故障传播的影响;
从不同类型的在线数据源中提取贡献的社会资本;
城市街道网络的结构熵、自组织和幂律：亚历山大思想的证据;

维基百科数学家网络分析

原文标题：

Analysis of the Wikipedia Network of Mathematicians

地址：

http://arxiv.org/abs/1902.07622

作者：

Bingsheng Chen, Zhengyu Lin, Tim S. Evans

摘要：

我们来看看由维基百科上的传记之间的超链接定义的数学家网络。我们将展示如何使用2013年，2017年和2018年拍摄的维基百科数据的三个快照来提取此信息。我们通过执行中心性分析来说明如何使用这些维基百科数据。这些测量表明，希尔伯特和牛顿是最重要的数学家。我们用我们的例子来说明中心性度量的优缺点，并说明如何提供中心度量的稳健性估计。在某种程度上，我们通过与其他两个来源的结果进行比较来做到这一点：早期对MacTutor网站上的传记进行研究，以及对伦敦帝国理工学院数学和物理学学生意见的小型非正式调查。

定量分区模型和本福德定律

原文标题：

Quantitative Partition Models and Benford’s Law

地址：

http://arxiv.org/abs/1606.02145

作者：

Alex Ely Kossovsky

摘要：

本福德定律预测，实际数据中数字最左侧的第一个有效数字在所有可能的1到9位数之间成比例，大致与LOG（1 + 1 /数字）相同，因此低位数比高位数频繁出现数字在第一位。关于遵守本福特定律的数据配置的两个基本先决条件是高阶数和正偏度，尾部落在直方图的右侧，因此定量配置使得小数量众多且大数量很少。在本文中，根据所得到的零件组的定量和数字行为来检查各种定量分区模型。在所有分区模型中发现的通用特性包含许多小部件，但只有很少的大部件，而本福德定律仅在某些特定分区情况下并在某些约束条件下有效。因此，本福德定律的另一个建议的观点是将其视为定量划分中更广泛的正偏度现象的特定子集。值得注意的是，这种观点在本福德定律的所有其他原因和解释中都是正确的，其中小的一般在模型的部分结构中或者在完全收敛到本福德之前总是超过大 – 在某种意义上赋予原则普遍性。总之，作为较小部分的组成，主动分割或被动地考虑大量的部分可以被认为是对物理科学中本福德定律的广泛经验观察的另一个独立解释。

用于社会推荐的图神经网络

原文标题：

Graph Neural Networks for Social Recommendation

地址：

http://arxiv.org/abs/1902.07243

作者：

Wenqi Fan, Yao Ma, Qing Li, Yuan He, Eric Zhao, Jiliang Tang, Dawei Yin

摘要：

近年来，可以自然地集成节点信息和拓扑结构的图神经网络（GNN）已被证明在学习图数据方面具有强大的功能。 GNN的这些优点为推进社交推荐提供了巨大的潜力，因为社交推荐系统中的数据可以表示为用户 – 用户社交图和用户 – 项图;学习用户和项目的潜在因素是关键。然而，构建基于GNN的社交推荐系统面临着挑战。例如，用户项图表对交互及其相关意见进行编码;社会关系具有异质的优势;用户涉及两个图（例如，用户 – 用户社交图和用户 – 项图）。为了同时解决上述三个挑战，在本文中，我们提出了一个新的图神经网络框架（GraphRec），用于社会推荐。特别是，我们提供了一种原则性的方法来共同捕获用户项图中的交互和意见，并提出框架GraphRec，它连贯地模拟两个图和异构强度。对两个真实数据集的大量实验证明了所提出的框架GraphRec的有效性。

具有不完美复制的多状态投票模型

原文标题：

A multi-state voter model with imperfect copying

地址：

http://arxiv.org/abs/1902.07253

作者：

Federico Vazquez, Ernesto S. Loscar, Gabriel Baglietto

摘要：

具有多个州的选民模型已经在诸如群体遗传，意见形成，物种竞争和语言动态等多种领域中得到应用。在动态的单个步骤中，随机选择的个体复制群体中随机邻居的状态。在该基本公式中，假设复制是完美的，因此在每个时间步骤生成个体的精确副本。在这里，我们介绍和研究平均场中的多状态选民模型的变体，其在复制过程中包含可变程度的不完美或错误。我们发现系统的排序属性，由 [ps -1 in [0,1] 中的参数测量，取决于 [0,1] 和人口中的复制错误 eta 的幅度大小 N 。在完美复制 eta = 0 的情况下，系统达到吸收配置，完整订单 psi = 1 ，所有 N 值。然而，对于任何程度的不完美 eta> 0 ，我们显示静止状态下的订单参数的平均值随 N 减少为 langle psi rangle simeq 6 /（ pi ^ 2 eta ^ 2 N） for eta ll 1 和 eta ^ 2 N gtrsim 1 。因此，系统在热力学限制 N 到 infty 中变得完全无序。此外，我们还显示 langle psi rangle simeq 1- 1.64 ， eta ^ 2 N 在消失的小错误限制 eta 到0 ，因此，平均来说，完成订单只能实现对于 eta = 0 。这些结果得到模型的蒙特卡罗模拟的支持，这也可以研究其他情景。

无标度相互依赖网络中的级联故障

原文标题：

Cascading failures in scale-free interdependent networks

地址：

http://arxiv.org/abs/1902.07347

作者：

Malgorzata Turalska, Keith Burghardt, Martin Rohden, Ananthram Swami, Raissa M. D’Souza

摘要：

大型级联在许多自然和工程复杂系统中是常见的。在本文中，我们使用真实网络拓扑（例如异质度分布）以及层内和层间度相关性来探索级联在网络中的传播。我们发现三个属性，无标度度分布，内部网络协调性和跨网络集线器到集线器连接，都是显著减小Bak-Tang-Wiesenfeld沙堆模型中大型级联大小的必要组件。我们证明了多层网络结构中存在的相关性影响了动态级联过程，并且可以防止故障在连接层上扩散。这些发现强调了内部和跨网络拓扑在优化互连系统的稳定性和稳健性方面的重要性。

在线社会网络中赎回最大化的

种子选择和社会优惠券分配

原文标题：

Seed Selection and Social Coupon Allocation for Redemption Maximization in Online Social Networks

地址：

http://arxiv.org/abs/1902.07432

作者：

Tung-Chun Chang, Yishuo Shi, De-Nian Yang, Wen-Tsuen Chen

摘要：

在线社会网络已成为利用信息传播中的社会影响力进行有效病毒式营销的媒介。然而，新的应用社会优惠券（SC）将社会推荐纳入优惠券不能通过以前的研究有效地解决，这些研究没有考虑SC分配的影响。分配的SC的数量限制每个用户的受影响的朋友的数量。在本文中，我们不仅研究种子选择问题，而且研究SC分配对优化赎回率的影响，赎回率代表SC分配的效率。因此，我们制定了一个名为种子选择和SC分配的赎回最大化（S3CRM）的问题，并证明了S3CRM的强度。我们设计了一种具有性能保证的有效算法，称为种子选择和社交优惠券分配算法。对于S3CRM，我们引入边际赎回的概念来评估种子和SC的投资效率。此外，为了实现均衡投资，我们开发了一种称为保证路径的新图结构，以探索优化赎回率的机会。最后，我们使用各种基线对我们提出的算法进行综合评估。结果验证了我们的想法，并显示了所提算法相对于基线的有效性。

投票给我！任意评分规则表决系统中

社会影响的选举控制

原文标题：

Vote for Me! Election Control via Social Influence in Arbitrary Scoring Rule Voting Systems

地址：

http://arxiv.org/abs/1902.07454

作者：

Federico Corò, Emilio Cruciani, Gianlorenzo D’Angelo, Stefano Ponziani

摘要：

在线社会网络用于在用户之间传播观点和想法，从而实现更快的沟通和更广泛的受众。意见以社会互动为条件的方式通常被称为社会影响力。在政治运动期间广泛使用社会影响来宣传和支持候选人。在这里，我们考虑在选民网络中利用社会影响力的问题，以便改变他们对目标候选人的意见，目的是增加他在广泛的投票系统中赢得/失去选举的机会。我们引入线性阈值排名，这是完善的线性阈值模型的自然而有力的扩展，它描述了考虑到行使影响量的意见变化。我们可以通过显示子模块来最大化目标候选人的得分，最高可达 1- frac {1} {e} 。我们利用这样的属性为建设性选举控制问题提供 frac {1} {3}（1- frac {1} {e}） – 近似算法。同样，我们在破坏性场景中得到 frac {1} {2}（1- frac {1} {e}） – 近似比率。该算法可用于任意评分规则投票系统，包括多个规则和borda计数。最后，我们对现实世界网络进行实验研究，测量目标候选者的胜利概率（PoV）和胜利率（MoV），验证模型并测试算法的能力。

如果投资者的信念倾向于预测未来强势的气候政策，那么撤资可能会刺破碳泡沫

原文标题：

Divestment may burst the carbon bubble if investors’ beliefs tip to anticipating strong future climate policy

地址：

http://arxiv.org/abs/1902.07481

作者：

Birte Ewers, Jonathan F. Donges, Jobst Heitzig, Sonja Peterson

摘要：

为了实现巴黎气候协议的雄心勃勃的目标，大部分化石燃料储备需要保持在地下。由于目前国家政府对减少温室气体排放的承诺目前还不够，机构和私人投资者以及从化石燃料中撤资的社会运动等行动者可能在向脱贫之路上施加压力给国家政府施加重要作用。在自适应社会网络中使用基于随机代理的共同演化金融市场模型和投资者对未来气候政策的信念，我们发现从化石燃料中撤资的动态显示出社会倾向于以化石燃料为基础的潜力经济。我们的结果进一步表明，对社会负责任的投资者具有杠杆作用：10—20％的一小部分，这些道德投资者的百分比足以引发碳泡沫的爆发，与帕累托原则一致。这些研究结果表明，剥离有可能与其他社会运动和政策工具一起促进脱碳，特别是考虑到强有力的国际气候政策迫在眉睫。我们的分析还表明可能存在碳泡沫，可能对经济产生不稳定影响。

NAIRS：神经注意力可解释推荐系统

原文标题：

NAIRS: A Neural Attentive Interpretable Recommendation System

地址：

http://arxiv.org/abs/1902.07494

作者：

Shuai Yu, Yongbo Wang, Min Yang, Baocheng Li, Qiang Qu, Jialie Shen

摘要：

在本文中，我们开发了一个名为NAIRS的神经注意力可解释推荐系统。自我关注网络作为系统的关键组件，旨在将注意力权重分配给用户的交互项目。该关注机制可以区分各种交互项目对用户简档的贡献的重要性。基于自我关注网络获得的用户配置文件，NAIRS提供个性化的高质量推荐。此外，它开发了视觉线索来解释建议。该演示应用程序与NAIRS的实现使用户能够与推荐系统进行交互，并持续收集训练数据以改进系统。演示和实验结果表明了NAIRS的有效性。

社交媒体上的虚假新闻：

一项数据驱动的综述

原文标题：

False News On Social Media: A Data-Driven Survey

地址：

http://arxiv.org/abs/1902.07539

作者：

Francesco Pierri, Stefano Ceri

摘要：

在过去几年中，研究界对社会网络上传播的虚假新闻问题越来越感兴趣。对于检测和表征虚假新闻的广泛关注的动机是对现实世界的这种威胁的相当大的反弹。事实上，社交媒体平台在传统新闻媒体上表现出特殊的特征，这些特征特别有利于欺骗性信息的泛滥。它们还针对该主题的各种潜在干预提出了独特的挑战。随着这个问题成为全球关注的问题，它也越来越受到学术界的关注。本次调查的目的是提供一份全面的研究报告，介绍在社交媒体上传播的虚假新闻的检测，特征描述和减轻方面的最新进展，以及等待该领域未来研究的挑战和开放性问题。我们使用数据驱动的方法，侧重于每个研究中使用的特征的分类，以表征虚假信息和用于指导分类方法的数据集。在调查结束时，我们重点介绍了最有希望解决虚假新闻的新兴方法。

基于机器学习的现实手机数据鲁棒预测模型

原文标题：

A Machine Learning based Robust Prediction Model for Real-life Mobile Phone Data

地址：

http://arxiv.org/abs/1902.07588

作者：

Iqbal H. Sarker

摘要：

现实生活中的移动电话数据可能包含嘈杂的实例，这是构建具有许多潜在负面后果的预测模型的基本问题。推断模型的复杂性可能增加，可能出现过度拟合问题，从而模型的整体预测精度可能降低。在本文中，我们解决了这些问题，并为个人用户的真实手机数据提供了一个强大的预测模型，以提高模型的预测精度。在我们的鲁棒模型中，我们首先通过使用朴素贝叶斯分类器和拉普拉斯估计器确定动态噪声阈值来有效地识别和消除训练数据集中的噪声实例，其可能根据用户与用户的独特行为模式而不同。之后，我们采用最流行的基于规则的机器学习分类技术，即决策树，对无噪声质量数据集构建预测模型。在各个移动电话用户的真实移动电话数据集（例如，电话呼叫日志）上的实验结果显示了我们的稳健模型在精度，召回和f-测量方面的有效性。

非马尔可夫恢复对网络上

可逆故障传播的影响

原文标题：

The effect of non-Markovian recovery on reversible failure propagation on networks

地址：

http://arxiv.org/abs/1902.07594

作者：

Zhaohua Lin, Mi Feng, Ming Tang, Zonghua Liu, Pak Ming Hui, Ying-Cheng Lai

摘要：

与传统的不可逆故障传播相比，自发恢复模型可以更好地描述网络系统（如金融和交通网络）上的故障传播。在本文中，我们研究了非马尔可夫恢复过程如何影响自发恢复系统中的级联失效动力学。为此，我们比较了两种故障恢复模型：非马尔可夫恢复（NMR）模型和相应的马尔可夫恢复（MR）模型。我们首先开发了MR和NMR模型的成对近似理论，它可以比经典平均场（MF）方法更准确地预测故障恢复系统的时间演变，稳态和滞后行为。我们发现虽然非马尔可夫恢复机制基本上不影响故障恢复系统的稳态和滞后行为，但这两种模型表现出不同的演化过程。在研究初始条件对相变和滞后行为的影响时，我们发现在滞后区域，NMR模型表现出非单调增长特征：随着初始失效节点的增加，稳态保持相对低失效阶段首先变为相对高失效阶段，然后再次进入相对低失效阶段。然后我们使用MF理论定性地解释这一现象，并指出在考虑非马尔可夫动力学时，我们不仅要从参数变化的角度来研究稳态，还要从初始条件来研究稳态。

从不同类型的在线数据源中

提取贡献的社会资本

原文标题：

Contributive Social Capital Extraction From Different Types of Online Data Sources

地址：

http://arxiv.org/abs/1902.07636

作者：

Sebastian Schams, Georg Groh

摘要：

这是一个反复出现的在线交流问题，难以评估未知人的属性。这可能导致各种问题，例如来自不值得信任的来源的“假新闻”的传播。在社会学中，人们通过其社会网络可获得的（社会）资源的总和通常被描述为社会资本。在本文中，我们从不同的角度来看待社会资本。我们不是评估人们因为他们在某个群体中的成员身份而拥有的优势，而是通过各种方式来推断一个人增加或可能添加到网络中的社会资本，即他们的贡献社会资本（CSC）。由于文献中没有关于一个人的社会资本究竟是什么的共识，我们会看到各种相关的属性：专业知识，声誉，可信度和影响力。针对五种不同的在线数据来源调查这些特征的分析：微博（例如，Twitter），社会网络平台（例如，Facebook），直接通信（例如，电子邮件），科学计量学和线程讨论板（例如，Reddit）。。在每个领域，我们讨论最近的出版物，并将重点放在所使用的数据源，实施的算法和性能评估上。将这些发现与贡献社会资本提取进行比较和设定。分析算法基于个体特征（例如，Twitter上的关注者），其比率或人的中心性度量（例如，PageRank）。机器学习方法，例如直接分类器（例如，支持向量机）使用与社会资本相关的基础事实。对这些方法的讨论旨在通过识别相关数据源和最适合的算法，并通过提供用于评估结果的测试方法来促进对该主题的研究。

城市街道网络的结构熵、自组织

和幂律：亚历山大思想的证据

原文标题：

Structure Entropy, Self-Organization, and Power Laws in Urban Street Networks: Evidence for Alexander’s Ideas

地址：

http://arxiv.org/abs/1902.07663

作者：

Jerome Benoit, Saif Eddin Jabari

摘要：

网络机制的研究对于更好地理解网络的更广泛属性和现象至关重要。在这里，我们在信息物理和统计物理学的框架内全面研究城市街道网络中的无标度网络。虽然自然道路（“命名街道”的替代品）与另一条道路相交的次数已被广泛报道为遵循自组织城市之间的无标度概率分布，但从中推导出城市街道网络的统计数据。基本原则很少受到关注。我们恢复了自组织城市中自然道路的离散帕累托概率分布，并预见了一个非标准的钟形概率分布，其中有一个Paretian尾部。我们的方法明确强调道路交叉结构，而不是像大多数调查那样隐含地抑制它。这种整体观点揭示了一种潜在的Galoisean代数结构。这样我们的方法就符合信息物理的思维方式。这使我们能够将城市街道网络设想为受Boltzmann介观熵守恒约束的不断发展的社会系统。通过引用Jaynes的最大熵原理，从基础的Galoisean层次结构到潜在的Paretian一致性的过程发生。最终，为了获得预测的统计数据，我们用渐近极限处的二项式成对代理社会模型解开潜在的离散Pareto概率分布。新兴范例可能适用于具有更复杂层次结构的系统。同时，根据你的发现，它似乎很好地反映了亚历山大的城市观念。已建立的统计数据可用于建立现实的城市模型，并发现管理我们城市的基本法律。