集智

核心速递

  • 符号图注意力网络;

  • 网络干扰下的策略定位;

  • 情感认知改进假新闻识别;

  • 用于复杂网络中渗流的消息传递方法的准确性;

  • Aw-Rascle 交通模型:Enskog 型动力学推导和推广;

  • NetSMF :大规模网络嵌入作为稀疏矩阵分解;

  • 2018年选举和拉美裔;

  • 人群水平流行病观测的网络推断;

  • 用于混沌系统预测的物理知识回声状态网络;

  • 论假新闻文章的连贯性;

  • 嘈杂社会学习模式中的细节平衡破坏与非均衡动态;

  • 通过高阶超图游走进行超网络科学研究;

  • 在线讨论的欺骗策略和威胁;

  • 5G移动回程网络的安全性:综述;

  • 将网络传播过程约简到马尔可夫种群模型;

  • 疾病传播动力学,及特征时间的影响;

  • 典型的物理博士入学标准限制了代表不足群体的进入,但不能预测博士完成情况和一些其他信息;

  • 生活(或至少是社会经济方面)只是旋转和博弈?;

  • 小冲击变换:一种用于识别社会技术时间序列中局部机制驱动动力学的分解方法;

  • 在异构信息网络中恢复链路权重;

符号图注意力网络

原文标题:

Signed Graph Attention Networks

地址:

http://arxiv.org/abs/1906.10958

作者:

Junjie Huang, Huawei Shen, Liang Hou, Xueqi Cheng

摘要:图或网络数据在现实世界中无处不在,包括社会网络,信息网络,交通网络,生物网络和各种技术网络。图数据的非欧几里德性质给图数据的建模和分析带来了挑战。最近,图神经网络(GNN)被提出作为处理图数据任务的通用且强大的框架,例如节点嵌入,链路预测和节点分类。

作为 GNN 的代表性实现,图注意力网络(GAT)成功应用于真实数据集上的各种任务。但是,GAT 设计用于仅具有正链接的网络,并且无法处理包含正链接和负链接的符号网络。在本文中,我们提出了符号图注意网络(SiGAT),将 GAT 推广到符号网络。SiGAT 将图模体结合到 GAT 中,以捕获符号网络研究中的两个众所周知的理论,即平衡理论和状态理论。

在 SiGAT 中,模体为我们提供了灵活的结构模式,用于在符号网络上聚合和传播消息,以生成节点嵌入。我们通过将其应用于带符号链路预测任务来评估所提出的 SiGAT 方法。三个真实数据集的实验结果表明,SiGAT 优于基于特征的方法,网络嵌入方法和最先进的基于 GNN 的方法,如符号图卷积网络(SGCN)。

网络干扰下的策略定位

原文标题:

Policy Targeting under Network Interference

地址:

http://arxiv.org/abs/1906.10258

作者:

Davide Viviano

摘要:实验和准实验的实证分析通常旨在确定最大化社会福利的治疗分配。在存在干扰的情况下,溢出效应会导致需要新的治疗统计方案。本文提出了一种在网络干扰下构建个体特定最优处理分配规则的新方法。

一些特征使得提出的方法对应用程序特别有吸引力:我们构建了依赖于任意一组个体,邻居和网络特征的目标规则,并且我们允许对策略函数进行一般约束;我们考虑异构任意的直接和溢出效应,可能是非线性的回归模型,并且我们提出了对模型错误指定具有鲁棒性的估计量;该方法灵活地适用于只观察到网络本地信息的情况。

从理论的角度来看,我们在干扰下建立了一套针对功利主义遗憾值的保证体系,并且我们证明它在实际和理论兴趣的情景中达到了 最小-最大 优化率。我们讨论了模拟中的实证表现,并通过调查社会网络在微观金融决策中的作用来说明我们的方法。

情感认知改进假新闻识别

原文标题:

Emotion Cognizance Improves Fake News Identification

地址:

http://arxiv.org/abs/1906.10365

作者:

Anoop K, Deepak P, Lajish V L

摘要:识别错误信息越来越被认为是具有高度潜在社会影响的重要计算任务。在本文中,我们考虑利用新闻文章的情感特征进行虚假新闻识别,并提出证据表明情绪认知表征更适合于此项任务。我们概述了利用情绪强度词典来开发情感化文本表示的技术,并评估这种表示在各种监督和无监督场景中的假新闻识别的效用。我们在一系列技术类型和参数设置中观察到一致和重要的经验主义收益,确立了新闻文章中情感信息的效用,这是一个经常被忽视的方面,用于错误信息识别的任务。

用于复杂网络信息过滤

的消息传递方法的准确性

原文标题:

On the accuracy of message-passing approaches to percolation in complex networks

地址:

http://arxiv.org/abs/1906.10377

作者:

Antoine Allard, Laurent Hébert-Dufresne

摘要:消息传递方法(MPA)是在真实复杂网络上获得复杂网络渗透的 quasi-analytical 预测准分析预测的最先进技术。除了直观和直接之外,它具有数学原理的优点:它在树上是精确的,同时对包含周期的网络产生一般良好的预测,就像大多数真正复杂的网络一样。

在这里,我们表明 MPA 不会对网络的一些不明确的树状近似进行计算,因为它的公式虽导致信任,但是考虑一个随机网络集合,其中原始网络会被克隆并洗牌无限数时间。我们得出结论,MPA 在树上是精确的这一事实并不意味着它在树状网络上几乎是精确的。事实上,我们发现非树网络越接近树,MPA 精度越差。

Aw-Rascle 交通模型:

Enskog 类型的动力学推导和推广

原文标题:

The Aw-Rascle traffic model: Enskog-type kinetic derivation and generalisations

地址:

http://arxiv.org/abs/1906.10665

作者:

Giacomo Dimarco, Andrea Tosin

摘要:我们从动力学描述中研究了二阶宏观交通模型的推导。特别是,我们将著名的 Aw-Rascle 模型作为 Enskog 类型动力学方程的流体动力学极限从车辆之间的微观二元相互作用的精确表征中恢复。与文献中提供的其他推导不同,我们的方法揭示了 Aw-Rascle 模型背后的多尺度物理。这进一步允许我们将其概括为符合 Aw-Rascle 一致性条件的新的二阶宏观模型,即无波情况应该比平均交通流情况更快地传播。

NetSMF:大规模网

络嵌入用作稀疏矩阵分解

原文标题:

NetSMF: Large-Scale Network Embedding as Sparse Matrix Factorization

地址:

http://arxiv.org/abs/1906.11156

作者:

Jiezhong Qiu, Yuxiao Dong, Hao Ma, Jian Li, Chi Wang, Kuansan Wang, Jie Tang

摘要:我们研究了大规模网络嵌入的问题,旨在发掘网络学习应用的潜在表示。先前的研究表明:

1)流行的网络嵌入基准,例如 DeepWalk ,实质上隐含地将具有封闭形式的矩阵分解

2)这种矩阵的显式分解产生比现有方法更强大的嵌入。然而,直接构造和分解这个密集的矩阵 – 在时间和空间方面都非常昂贵,使得它不能扩展到大型网络。

在这项工作中,我们提出了大规模网络嵌入算法作为稀疏矩阵分解(NetSMF)。

NetSMF 利用谱稀疏化的理论有效地稀疏上述密集矩阵,从而显著提高嵌入式学习的效率。稀疏矩阵在谱上接近原始密集矩阵,具有理论上有界的近似误差,这有助于保持学习嵌入的表示能力。我们在各种规模和类型的网络上进行实验。结果表明,在流行的基准测试和基于因子分解的方法中,NetSMF 是实现高效率和有效性的唯一方法。我们表明,NetSMF 只需要24小时就可以为拥有数千个节点的大规模学术协作网络生成有效的嵌入,而 DeepWalk 会花费数月时间,而且对于密集矩阵分解解决方案而言,计算上是不可行的。

2018年选举和拉美裔

原文标题:

The 2018 Elections and Latinos

地址:

http://arxiv.org/abs/1906.10736

作者:

Claudia Flores-Saviaga, Saiph Savage

摘要:鉴于拉美裔社区是美国第二大族群,了解拉丁美洲人在美国大选期间如何讨论和针对社交媒体是至关重要的。本文通过对 Reddit 的数据分析来探讨这些问题,Reddit 是政治讨论中最着名和最受欢迎的社交媒体平台之一。我们从2017年9月24日到2018年9月24日收集了提及拉丁美洲和美国中期选举的 Reddit 帖子。我们分析了人们随着时间推移的帖子模式,以及发布大部分内容和最受欢迎内容的个人的数字痕迹。

我们的研究强调了在美国中期选举之前围绕拉丁美洲人的在线讨论中存在的数据空白。我们观察到缺乏中立的演员参与拉丁美洲的政治话题。似乎是更极端主义的声音(即在次级 reddit 经营者,承担政治煽动者身份)正在创造关于拉丁美洲人最大量的治内容。我们在结束报告时讨论了数据空洞的可能危险(特别是关于它们与错误和虚假信息的关系)以及增加拉丁裔社区参与未来美国选举的建议。

人群水平流行

病观测的网络推断

原文标题:

Network Inference from Population-Level Observation of Epidemics

地址:

http://arxiv.org/abs/1906.10966

作者:

F. Di Lauro, J.-C. Croix, M. Dashti, L. Berthouze, I.Z. Kiss

摘要:网络范式被认为是复杂系统建模的黄金标准之一,例如对大脑中的流行病或神经元活动建模;但是,在大多数情况下,这种动态展开的网络的确切性质是未知的。这推动了大量的网络推理工作。虽然大量的工作涉及基于详细的节点级时态数据推断网络结构,但在这项工作中,我们解决了当只有人口级时间发生率数据可用时推断底层网络家族的更具挑战性的情况。

一个关键的障碍是随之而来的随机流行病模型的高度维度。为了解决这个问题,我们通过出生 – 死亡过程来估计网络上的易感-感染-易感(SIS)模型,其过程编码基础网络的结构和疾病动态。使用系统模拟,我们提出了这些速率的简约(三参数)模型,并显示不同的已知网络系列映射到该模型的参数空间的不同区域。该结果提供了不同网络族的先验表征。

然后,给定人口级别的时间流行病数据,我们使用贝叶斯分类器来推导不同网络家族的后验分布。我们表明,在合成和真实网络上进行测试时,我们所提出的方法可以产生出色的结果。我们的框架可以很容易地扩展到许多网络系列和传播过程,它可以从人口级数据中提供网络推理的新基准。

用于混沌系统预测

的物理信息回声状态网络

原文标题:

Physics-Informed Echo State Networks for Chaotic Systems Forecasting

地址:

http://arxiv.org/abs/1906.11122

作者:

Nguyen Anh Khoa Doan, Wolfgang Polifke, Luca Magri

摘要:我们提出了一个物理知识的回声状态网络(ESN)来预测混沌系统的演化。与传统的 ESN 相比,ESN 经过培训获取物理信息之后,可以解决监督学习任务,同时确保他们的预测不会违反物理定律。这是通过在 ESN 训练期间引入额外的损失函数来实现的,其在不需要任何额外训练数据的情况下惩罚非物理预测。这种方法的有效性在混沌 Lorenz 系统上得到证明,与常规 ESN 相比,物理信息 ESN 通过大约两个 Lyapunov 时间改善了可预测性范围。所提出的框架显示了使用机器学习结合先前物理知识来改进混沌动力系统的时间精确预测的潜力。

论假新闻文章的连贯性

原文标题:

On the Coherence of Fake News Articles

地址:

http://arxiv.org/abs/1906.11126

作者:

Iknoor Singh, Deepak P, Anoop K

摘要:新闻和在线媒体来源中假新闻的产生和传播正在成为一种具有高度社会意义的现象。使用数据驱动的分析来对抗它们已经吸引了学者的目光。在这项研究中,我们分析假新闻文章与合法新闻文章的文本连贯性。我们利用自然语言处理和数据科学中最先进的方法,开发了三种文本连贯性的计算公式。

然后分析来自具有伪造/合法文章标记的广泛不同领域的两个真实世界数据集的文本连贯性。我们观察到虚假和合法新闻文章在文本连贯性方面存在明显差异,与合法新闻文章相比,假新闻文章在连贯性方面的得分一直较低。虽然假冒新闻文章与合法文章相比的相对一致性缺陷构成了我们研究的主要观察,但我们分析了差异的几个方面,并概述了进一步探究的潜在途径。

嘈杂社会学习模式中的

细节平衡破坏与非均衡动态

原文标题:

Broken Detailed Balance and Non-Equilibrium Dynamics in Noisy Social Learning Models

地址:

http://arxiv.org/abs/1906.11481

作者:

Tushar Vaidya, Thiparat Chotibut, Georgios Piliouras

摘要:我们提出了新的 Degroot 型社会学习模型中的实时反馈,以研究嘈杂的信息源对社会网络中共识形成的影响。与标准的 Degroot 框架不同,嘈杂的信息模型破坏了共识的形成。另一方面,嘈杂的观点动态收敛于均衡分布,包含了单体意见之间的相关性。有趣的是,这种平衡分布也是具有非零概率环路的非平衡稳态(NESS)。因此,噪声信息源长时间导致 NESS 编码学习个体长时间的观点动态。

通过高阶超图游

走进行超网络科学研究

原文标题:

Hypernetwork Science via High-Order Hypergraph Walks

地址:

http://arxiv.org/abs/1906.11295

作者:

Sinan G. Aksoy, Cliff Joslyn, Carlos Ortiz Marrero, Brenda Praggastis, Emilie Purvine

摘要:我们提出高阶超图行走作为一个框架,将基于图的网络科学技术推广到超图。超图中的边入射是定量的,由此产生具有长度和宽度的超图行走。然后概括为超图的图方法包括连通分量分析,基于图距离的度量,例如紧密度中心性,以及基于主题的度量,例如聚类系数。我们将这些方法的高阶类比应用于现实世界的超网络,并显示它们揭示了基于图的方法无法检测的细微差别和可解释的结构。

最后,我们将三个生成模型应用于数据,并发现基本超图特性(如密度和度分布)不一定能表述这些新的结构测量。我们的工作展示了当使用专门用于捕获超图本地现象的工具时,超图结构数据的分析更加丰富,并为此提出了一条可能的途径。

在线讨论中存

在的欺骗策略和威胁

原文标题:

Deception Strategies and Threats for Online Discussions

地址:

http://arxiv.org/abs/1906.11371

作者:

Onur Varol, Ismail Uluturk

摘要:沟通在社会系统中起着重要作用。有效的通信需要在没有中断或噪音的情况下在个人之间传输消息,这可以成为实现预期影响的有力工具。可以利用内容的语言和个性来欺骗和操纵收件人。

这些欺骗和说服策略可用于在政治和商业中发挥权力和积累资本。在这项工作中,我们对这些欺骗和说服策略多年来如何应用于不同的沟通渠道进行了适度的审查。我们提供了过去100年中不同时期发生的活动的示例,以及相应的传播媒介。在互联网时代,我们可以享受大量信息和无国界通信的能力。

然而,恶意行为者致力于滥用在线系统来传播虚假信息,破坏沟通,并通过社交机器人等自动化工具操纵人员。重要的是研究历史诈骗说服工作,以便能够调查现代实践和工具。在这里,我们讨论当前对社会的威胁,同时与历史实践和最近对检测和预防系统的研究工作相互比较。

5G移动回程网络的安全性:综述

原文标题:

Security of 5G-Mobile Backhaul Networks: A Survey

地址:

http://arxiv.org/abs/1906.11427

作者:

Gaurav Choudhary, Jiyoon Kim, Vishal Sharma

摘要:具有初始数据网络功能和利用率的移动数据的快速协商已成倍增加数据流量。这种流量消耗了 5G 移动回程网络中的各种关键问题。移动回程的安全性至关重要;然而,有限数量的文章已经探讨了这样的要求。本文讨论了安全的 5G 移动回程架构的潜在设计问题和主要挑战。已经探讨了现有最先进的安全移动回程解上的决方案的比较及其主要贡献。

此外,本文还讨论了与服务质量(QoS),路由和调度,资源管理,容量增强,延迟,安全管理以及使用软件定义网络和毫米波技术等机制进行切换相关的各种关键问题。此外,还提出了研究挑战和这项技术未来的轨迹。

将网络传播过程约

简到马尔可夫种群模型

原文标题:

Reducing Spreading Processes on Networks to Markov Population Models

地址:

http://arxiv.org/abs/1906.11508

作者:

Gerrit Großmann, Luca Bortolussi

摘要:复杂网络上的随机过程,其中每个节点在几个隔间之一中,并且相邻节点彼此相互作用,可用于描述各种现实中的传播现象。然而,这些过程的计算分析受到其基础状态空间的巨大规模的阻碍。在这项工作中,我们证明了 lumping 可以用于将任何流行病模型减少到马尔可夫人口模型(MPM)。

因此,我们提出了一种基于节点划分的新型 lumping 方案。通过施加不同类型的计数抽象,我们获得具有近似于原始系统的自然 MPM 表示的粗粒度马尔可夫模型。这使得有可能将为 MPM 开发的丰富的近似技术池转移到复杂网络动态的计算分析中。研究中我们提出数值计算例子来研究 MPM 的准确性,集总状态空间的大小和计数抽象方法类型之间的关系。

疾病传播动力学,

及特征时间的影响

原文标题:

Dynamics of disease spread. Effect of the characteristic times

地址:

http://arxiv.org/abs/1906.11556

作者:

O. Mosbah, N. Zekri, M. Mokhtari, S. Sahraoui

摘要:这项研究中我们使用基于 Watts 和 Strogatz 小世界网络的随机易感-暴露-传染-免疫(SEIR)流行病模型的动态变体,通过数值和分析地研究异质群体传播感染的动态特性。该模型包括通常表征传染性疾病的主要现实参数,例如感染力,潜伏期和感染时间。

只要潜伏时间仍然小于感染时间,受感染个体的比例随时间呈指数增长,否则会出现振荡行为。这可以解释健康预防服务观察到的周期性行为。还表明,如果调查期与感染的特征时间不完全一致,则定期流行病学调查会高估或低估感染的动态。我们进一步讨论了该模型中涉及的扩散过程,以及它们与感染特征时间的关系。

典型的物理博士入学标准限制

了代表不足群体的进入,但不能预

测博士完成情况和一些其他信息

原文标题:

Typical Physics PhD Admissions Criteria Limit Access to Underrepresented Groups but Fail to Predict Doctoral Completion, including some additional information

地址:

http://arxiv.org/abs/1906.11618

作者:

Casey W. Miller, Benjamin M. Zwickl, Julie R. Posselt, Rachel T. Silvestrini, Theodore Hodapp

摘要:这项工作旨在了解物理学中使用的典型录取标准对于确定完成博士学位的学生的有效性。通过对样本的多元统计分析,其中包括大约八分之一的2000至2010年进入物理博士课程的学生,我们发现本科 GPA 和研究生入学考试(GRE),语言和物理学科的传统招生指标测试不能预测美国物理学研究生课程的完成情况,其效果通常由招生委员会承担。我们发现只有本科 GPA 才能在所有研究模型中与物理博士学位完成有统计学意义的关联。在没有模型的情况下,GRE Physics 或 GRE Verbal 预测博士学位完成。

GRE 定量评分与所研究的四种模型中的两种具有统计学上显著的关系。然而,在实践中,完成博士学位的概率在物理专业的美国考生中排名第10和第90百分位的学生变化不到10个百分点。注意到 GRE 分数中存在显著的种族,性别和公民身份差异,这些研究结果表明,在典型的博士招生过程中严重依赖这些考试成绩,对于增加物理学的获取,多样性和公平性具有威慑作用。滥用 GRE 分数可以选择针对已经不足的群体和美国公民,他们的工具无法有效预测博士学位完成情况。

生活(或至少是社会

经济方面)只是自旋和博弈?

原文标题:

Is Life (or at least socio-economic aspects of it) just Spin and Games?

地址:

http://arxiv.org/abs/1906.11683

作者:

Shakti N. Menon, V. Sasidevan, Sitabhra Sinha

摘要:试图用物理学中的概念和思想来解释不同的社会和经济现象的企业有着悠久的历史。特别是统计力学经常被视为最有可能提供实现这一目标的手段,因为它为描述包含大量相互作用实体的系统的集体行为提供了清晰而具体的理论框架。近年来,一些物理学家试图利用这些工具来揭示过多的社会经济现象背后的机制。这些工作逐渐促使做着这些工作的物理学家形成社区- 他们的学术被一些人称为“经济物理学”。

然而,这一领域的出现也暴露了几条学术断层。社会科学家经常将物理学启发模型(例如涉及自旋耦合的模型)视为经验现象的过度简化。与此同时,虽然理性工作者的模型在战略上基于完整的信息做出选择以最大化其效用,但在经济学中常用,许多物理学家认为它们过于偏离现实。

我们在这里表明,虽然这些对比方法似乎不可调和,但实际上它们之间存在许多相似之处和类比。此外,我们建议可能需要一种新的统计力学公式,以便将博弈论形式主义完整地映射到统计物理学框架。这可能确实是经济物理学最重要的贡献。

小冲击变换:一种用

于识别社会技术时间序列中

局部机制驱动动力学的分解方法

原文标题:

The shocklet transform: A decomposition method for the identification of local, mechanism-driven dynamics in sociotechnical time series

地址:

http://arxiv.org/abs/1906.11710

作者:

David Rushing Dewhurst, Thayer Alshaabi, Dilan Kiley, Michael V. Arnold, Joshua R. Minot, Christopher M. Danforth, Peter Sheridan Dodds

摘要:我们引入了一种无监督模式识别算法,这个算法称为离散小冲击变换(DST),通过该算法可以提取时间序列的局部动态。假设由基础确定性机制生成的时间序列与纯随机空模型具有显著不同的 DST 。我们将 DST 应用于社会技术数据源,在十年内推特上的一部分单词的使用频率,并展示了 DST 过滤高维数据和自动提取异常行为的能力。

在异构信息网络中恢复链路权重

原文标题:

Link weights recovery in heterogeneous information networks

地址:

http://arxiv.org/abs/1906.11727

作者:

Hong-Lan Botterman, Robin Lamarche-Perrin

摘要:社会技术系统通常由许多相互交织的网络组成,每个网络通过各种方式连接不同类型的对象(或演员)。由于这些网络是相互依赖的,因此可以利用这种纠缠结构从其他相关网络提供的信息中研究特定网络中的交互模式。因此,我们提出并测试了一种方法来恢复异构信息网络(HIN)中丢失或未观察到的链路的权重-使用由多种类型的实体及其关系组成的系统的抽象表示。这个方法首先给定 HIN 中的一对节点,这项工作旨在恢复到这两个节点的事件链路的确切权重,知道 HIN 中存在的一些其他链路。

为此,由路径约束的随机游走产生的概率分布,即行动单位被迫仅遵循特定的节点类型和边类型序列的随机游走,能够捕获特定语义并且通常称为元路径,被组合以线性方式以近似期望的结果。此方法足以计算任何类型节点之间的链接权重。Twitter 和参考数据的实验表明了该方法的适用性。

来源:网络科学研究速递

审校:陈曦

编辑:孟婕

声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。

近期网络科学论文速递

网络流行病模型分析 等10篇

语义神经网络预测科研趋势等12篇赢者通吃——如何赢得网络全球化 等10篇

学术生涯早期与顶尖科学家合作可获得职业竞争优势 等24篇

加入集智,一起复杂!


集智

集智俱乐部QQ群|877391004

商务合作及投稿转载|swarma@swarma.org

搜索公众号:集智俱乐部

加入“没有围墙的研究所”

集智

让苹果砸得更猛烈些吧!

原文始发于微信公众号(集智俱乐部):集智