集智

核心速递

  • 估计在线视频网络中的注意力流;

  • 有多少人可以同时穿过行人空间?复杂流动情况对基本图形状的影响;

  • 有向图是不同的:为什么方向性在复杂系统中很重要;

  • 发展中国家的小农户的移动社区感知;农作物健康监测的规模试点;

  • 随机阈值图的渐近度分布;

  • SilceNDice:挖掘多视图的可疑多属性实体组;

  • 面向大型局部树状图的动力系统稳定性谱理论;

  • 市场崩盘中关键股票的涌现;

  • 板球比赛的随机微分理论;

  • 通过节点复制增长的有向随机网络中最短路径长度分布的分析结果;

  • 社交媒体的使用揭示了自然灾害后地区如何恢复;

  • 区块链技术在农业和食品供应链中的崛起;

  • 城市几何如何解释城市规模法则并确定其指数;

  • 通过迁移学习防止投毒攻击的鲁棒图神经网络;

  • 预测研究人员的发表生产率:分段泊松模型;

  • 找到合适的网络规模:通过谱聚类有效识别因果关系;

  • 遍历Twitter:基于语言的有效推特账户关注网络采样;

  • 图聚类可视化的质量度量;

  • 阿拉伯人和无神论:阿拉伯Twitter空间中的宗教讨论;

估计在线视频网络中的注意力流

原文标题:

Estimating Attention Flow in Online Video Network

地址:

http://arxiv.org/abs/1908.07123

作者:

Siqi Wu, Marian-Andrei Rizoiu, Lexing Xie

摘要:在线视频在互联网流量中显示出巨大的增长。大多数视频托管网站都实现了推荐系统,该系统将视频连接到有向网络,并在概念上充当用户导航路径的来源。目前,关于如何在这样的大规模网络上分配人类注意力以及推荐系统的影响知之甚少。本文首先构建了一个视频网络Vevo,它是一个由60740个音乐视频通过推荐链接连接起来的YouTube视频网络,并收集了它们的相关观看动态。这导致在9周的时间内每天总共有3.1亿次观看。进一步,我们提出了连接推荐网络结构和视频注意力动态的大规模测量。我们使用蝴蝶结结构来表征Vevo网络,研究发现它的核心组件(23.1%的视频)占据了大部分注意力(82.6%的观看次数),是由它们之间主要推荐的视频组成的。这表明视频推荐与注意力分配不平等之间存在联系。最后,我们解决了估计视频推荐网络中注意力流的任务。我们提出了一个能反映网络效应的模型来预测视频的受欢迎程度,并且我们证明它始终优于基线。该模型还识别出一组由于推荐网络而受到关注的艺术家。总之,我们的研究和模型提供了一套新的工具来更好地理解推荐系统对集体社会关注的影响。

有多少人可以同时

穿过行人空间?复杂流

动情况对基本图形状的影响

原文标题:

How many people can simultaneously move through a pedestrian space? The impact of complex flow situations on the shape of the fundamental diagram

地址:

http://arxiv.org/abs/1908.07208

作者:

Dorine C. Duives, Martijn Sparnaaij, Winnie Daamen, Serge P. Hoogendoorn

摘要:行人拥挤时间发生的频率越来越高。随着人们对公共空间的需求不断增加,人们对步行空间的限制越来越感兴趣。本文主要针对简单的运动基本情况、低密度情况和(或)均质人群,对横截面的最大需求量进行了研究。因此,目前尚不清楚他们的研究结果在多大程度上适用于在现实世界情景中经常遇到的异构高密度人群。拥挤限制实验试图再现人群的运动状态,这些群体经历了比此时记录的更高密度的异质人群。本文旨在研究当前实验室研究与现实世界中拥挤步行空间中的人群动力学之间存在的三个重要差异的影响,即人群异质性、高密度运动和(更)复杂的运动。研究表明,在不同的运动基本情况和流量比下,最大持续流量、最大局部和全局密度存在显著差异。此外,研究结果还表明,在实验室条件下,利用非均匀的行人群体,可以重建高密度下的连续流动。此外,实验结果表明,当场景变得更加困难(即双向到交叉)并且碰撞避免机会减少(即80-20到50-50流量比)时,最大全局流量减小。因此,本文得出结论,行人基础设施的最大流量随着复杂度的增加而降低。

有向图是不同的:为什么

方向性在复杂系统中很重要

原文标题:

Digraphs are different: Why directionality matters in complex systems

地址:

http://arxiv.org/abs/1908.07025

作者:

Samuel Johnson

摘要: 许多描述复杂系统的网络都是有向的:元素之间的相互作用是不对称的。最近的研究表明,这些网络可以显示营养相干性或非正态性等特性,从而影响系统的稳定性,渗透性和其他动力学特征。我在这里指出,这些拓扑性质有一个共同的起源,因为有向网络的边可以与全局方向对齐( 或不对齐)。本文还说明了即使在最简单的模型中,这也会导致丰富和意想不到的动力学行为。

发展中国家的小农户的移动社区

感知; 农作物健康监测的规模试点

原文标题:

Mobile community sensing with smallholder farmers in a developing nation; A scaled pilot for crop health monitoring

地址:

http://arxiv.org/abs/1908.07047

作者:

Daniel Mutembesa, Ernest Mwebaze, Solomon Nsumba, Christopher Omongo, Humphrey Mutaasa

摘要: 此前,作为一种小规模社区传播活动,在农作物病虫害监测方面已经进行有过众包实验的试点研究,其中包括小农、推广人员和专家。虽然这些试点已经证明了使用移动电话进行社区感知的可行性,而且全年都有移动电话收集大量的实时数据,可以补充资源匮乏的农业专家调查,但是他们在推广社区感知的规模化实施方面受到限制。因此,本文展示了一个大规模部署移动特设监测的案例,该监测用于对来自乌干达175个小农户的木薯实时监控数据进行众包。本文介绍了一个改进的移动特设监视生态系统,以适应小农户农民主体、通信模型和数据收集模型,旨在涵盖监测规模的空间利益、部署计划、培训方法和激励结构。本文还介绍了农民主体人所做的早期贡献,这些贡献可用于监测地区间种植材料的移动,绘制木薯品种、繁殖地点和很少或根本没有农业推广服务的社区,以及可能指导高发病率地区的精确专家调查。

随机阈值图的渐近度分布

原文标题:

Asymptotic degree distributions in random threshold graphs

地址:

http://arxiv.org/abs/1908.07066

作者:

Armand M. Makowski, Siddharth Pal

摘要:本文讨论了一类随机门限图在多节点域上的极限度分布。该分析是在对基础适应度变量的分布的弱假设下进行的。这一假设符合指数分布,并确定了一个自然标度,在此标度下显示了以下极限结果:节点度分布,即所有节点度值大小的分布,在分布中收敛到极限pmf。但是,对于每个 d = 0,1,… ,具有给定度 d 的节点的分数仅在分布中收敛到非退化随机变量Pi(d)(其分布取决于 d),而不是通常的那样在概率上收敛到上述极限节点pmf。Pi(d)的分布仅通过其特征函数来确定。该结果的含义包括:(i)经验节点分布不能用作限制节点pmf的主体或估计; (ii)即使在同构图中,网络范围的分布和节点度分布也可能捕获大量不同的信息; (iii)正如一些作者所论述的那样,指数分布的随机阈值图并能为Barabasi-Albert的模型提供替代无标度模型;这两个模型的度分布无法进行有意义的比较!

SilceNDice:挖掘

多视图的可疑多属性实体组

原文标题:

SilceNDice: Mining Suspicious Multi-attribute Entity Groups with Multi-view Graphs

地址:

http://arxiv.org/abs/1908.07087

作者:

Hamed Nilforoshan, Neil Shah

摘要: 鉴于网络平台的覆盖范围,不良行为者有相当大的动机以牺牲平台完整性为代价来操纵和欺骗用户。这刺激了许多可疑行为检测任务的研究,包括检测sybil账户、虚假信息和支付诈骗。在本文中,我们发现许多这样的问题可以在一个共同的框架中通过提出一个检测任务来解决,该任务旨在查找跨多个属性的实体组(同时创建的sybil帐户和位置)。首先,我们提出了一个新的多视图图挖掘问题,在这个问题中,不同的视图反映了不同属性之间的相似性,以及上下文之间的相似性和属性的重要性。其次,考虑到实体群在多个视图上的同步性异常,提出了一种新的可疑度度量方法,方法遵循了现有度量方法不具备的直观要求。并最后,我们提出了SliceNDice算法,该算法能够有效提取高度可疑的实体组,在Snapchat的大型广告客户生态系统(89%精度和真实欺诈环的众多发现)的强检测性能和发现方面展示出其在生产中的实用性,标记显著优于基线(在模拟设置中有超过97%的精度/召回率)和线性可扩展性。

面向大型局部树状图

的动力系统稳定性谱理论

原文标题:

Spectral theory for the stability of dynamical systems on large oriented locally tree-like graphs

地址:

http://arxiv.org/abs/1908.07092

作者:

Izaak Neri, Fernando Lucas Metz

摘要: 我们开发了一个数学理论,该理论主要通过一组随机耦合的二阶微分方程模拟在一个局部树状网络上大型动力系统中静止状态的线性稳定性。我们的方法提供了描述自由度之间相互作用的随机矩阵的主导特征值的解析表达式,主导特征值的符号表征了系统的稳定性。我们在具有规定度分布的有向随机图上验证了这种方法,并发现主导特征值是通用的,因为它只取决于几个集合参数(包括平均度和度相关系数)。此外,我们还通过推导出用于与主导特征值相关联的左、右特征向量的分量的统计分析表达式来刻画感兴趣系统的不稳定模式。最后,我们简要讨论了如何将这种方法扩展到具有对角线无序和无向耦合的模型中。

市场崩盘中关键股票的涌现

原文标题:

The emergence of critical stocks in market crash

地址:

http://arxiv.org/abs/1908.07244

作者:

Shan Lu, Jichang Zhao, Huiwen Wang

摘要: 在金融市场等复杂系统中,个人风险承受能力对系统弹性至关重要。单一安全价格限制,旨在通过避免价格剧烈波动来保护投资者的风险承受能力,这被认为是在崩溃时助长市场恐慌的原因。因此,稳定整个系统的关键市场信心与价格限制之间的关系是系统弹性的一个重要方面。本文利用一个简单的投资者和股票网络动态模型,从理论上导出了一个价格极限与临界市场信心之间的非预期线性关系,并进行了实证检验。我们的研究结果强调了相对“小”但关键股票的重要性,这些股票通过将破产从外围国家转移到核心国家来推动金融体系崩溃。这些小型股票主要来自整个市场的同质化投资策略,无意中抑制了系统的弹性,增加了个人的风险承受能力。因此,通过施加随机投资要求来缓解羊群行为(从众行为),可以提高市场弹性。

板球比赛的随机微分理论

原文标题:

Stochastic differential theory of cricket

地址:

http://arxiv.org/abs/1908.07372

作者:

Santosh Kumar Radha

摘要: 介绍了一种利用随机微分方程(SDE)分析板球运动过程的新形式。这一理论使我们能够用三个关键变量来定量地描述每一个团队,这三个变量具有与之相关的物理意义。这与基于不同静态累积量组合的传统评级/排名团队系统形成对比。在此基础上,提出了一种新的以球数级数计算获胜概率的方法。

通过节点复制增长

有向随机网络中最

短路径长度分布的分析结果

原文标题:

Analytical results for the distribution of shortest path lengths in directed random networks that grow by node duplication

地址:

http://arxiv.org/abs/1908.07376

作者:

Chanania Steinbock, Ofer Biham, Eytan Katzav

摘要: 本文给出了通过节点复制增长的有向网络模型中最短路径长度(DSPL)分布的精确分析结果。这些模型可用于研究基因调控网络和科学引文网络的结构和生长动力学。从初始种子网络开始,在每个时间步骤,选择称为母节点的随机节点进行复制。其子节点被添加到网络中并以概率 p 复制母节点的每个输出链路。另外,子节点形成到母节点自身的有向链路。因此,该模型被称为有向节点复制(DND)模型。在该网络中,并非所有节点对都通过有向路径连接,尽管相应的无向网络由单个连接的组件组成。更具体地说,在大的网络限制中,仅有一小部分节点通过有向路径连接。为了计算通过有向路径连接的那些节点对之间的DSPL,我们得出了概率 P_t(L=l),l= 1,2,… 的时间演化的主方程,其中l是最短有向路径的长度。通过求解主方程,我们得到P_t(L=l)的闭合形式表达式。发现在 t 时的DSPL由初始DSPLP_0(L=l)的卷积、泊松分布和泊松分布之和组成。通过有向路径连接的节点对之间的平均距离E _t [L | L < infty] 被发现与网络大小 N_t 呈对数依赖关系。然而,由于在大网络限制下,由有向路径连接的节点对的比例越来越小,因此,与相应的无向网络不同,有线DND网络不是小型世界网络。

社交媒体的使用揭示了

自然灾害后地区如何恢复

原文标题:

Social media usage reveals how regions recover after natural disaster

地址:

http://arxiv.org/abs/1908.07384

作者:

Robert Eyre, Flavia De Luca, Filippo Simini

摘要: 临近预报和预测自然灾害(例如地震,洪水,飓风)对于资产、人员和社会的保护具有重要意义,特别是对于评估此类系统从极端事件中恢复的能力至关重要。传统的灾难恢复估计(例如调查和访谈)通常成本高昂,耗时且无法扩展。在这里,我们提出一种方法来间接估计在城市地区的小企业的在紧急情况下的恢复状态(“停机时间”)以查看他们在社交媒体上的在线发布活动。通过分析事件发生前后的时间序列,我们对尼泊尔、波多黎各和墨西哥发生的三次自然灾害中小型企业的停工时间进行了量化,通过一种方便可靠的方法来预测经济活动的灾后恢复状况,有助于地方政府和决策者更好地进行战略调整,并更有效地分配现有资源。

区块链技术在农业和

食品供应链中的崛起

原文标题:

The Rise of Blockchain Technology in Agriculture and Food Supply Chains

地址:

http://arxiv.org/abs/1908.07391

作者:

Andreas Kamilaris, Agusti Fonts, Francesc X. Prenafeta-Boldu

摘要: 区块链是一种新兴的数字技术,允许在分布的不受信任方之间进行无处不在的金融交易,而不需要银行等中介机构。本文探讨了区块链技术对农业和食品供应链中的影响,介绍了现有的项目和计划,并讨论了总体影响、挑战和潜力,并对这些项目的成熟度提出了批评性意见。研究结果表明,区块链是一种有前途的技术,有助于建立一个透明的食品供应链,在各种食品和食品相关问题上有许多持续的举措,但仍然存在许多障碍和挑战,这阻碍了区块链在农业中的广泛普及。这些挑战涉及技术、教育、政策和管理框架等方面。

城市几何如何解释城市

规模法则并确定其指数

原文标题:

How the geometry of cities explains urban scaling laws and determines their exponents

地址:

http://arxiv.org/abs/1908.07470

作者:

Carlos Molinero, Stefan Thurner

摘要: 城市规模法则将社会经济、行为和物理变量与城市人口规模联系起来,为城市规划提供了新的范式,并对充分考虑了城市恢复弹性和经济。与文化和气候无关,几乎所有城市都有两个基本的标度指数,一个是相关的次线性指数,一个是相关的超线性指数。在这里我们证明了基于城市基本分形的几何关系,得出指数及其关系。次线性标度是道路网络分形维数与三维人口分布的比值,超线性标度是受城市几何约束的人与人之间相互作用的结果。我们用4750个欧洲城市的数据证明了该框架的有效性。我们做了几个可测试的预测,包括城市的平均高度与人口规模的关系,以及在一个临界的人口规模下,增长由水平密集型向三维增长型转变。

通过迁移学习防止投毒

攻击的鲁棒图神经网络

原文标题:

Robust Graph Neural Network Against Poisoning Attacks via Transfer Learning

地址:

http://arxiv.org/abs/1908.07558

作者:

Xianfeng Tang, Yandong Li, Yiwei Sun, Huaxiu Yao, Prasenjit Mitra, Suhang Wang

摘要: 图神经网络(GNN)具有广泛的应用。然而,它们在抵抗投毒攻击时的鲁棒性却受到批评。已有研究表明,在图拓扑或节点特征上使用不明显的修改可以显著降低GNN的性能。设计强大的图神经网络以抵抗投毒攻击是非常具有挑战性的,并且已经采取了多种方法。现有的研究主要是利用毒害图来减少敌对边缘的负面影响,由于毒害图不能区分敌对边缘和正常边缘,所以毒害图是次优的。另一方面,通常在现实世界中可以获得与目标毒害图相似的域的清晰图。通过扰乱这些清晰图,我们创建了有监督的知识来训练检测对抗边缘的能力,从而提高GNN的鲁棒性。然而,现有工作忽略了清晰图的这种潜力。为此,我们通过研究清晰图来提高GNNs抵御投毒攻击的鲁棒性。具体来说,我们提出了PA-GNN,它依赖于惩罚性聚合机制,通过赋予它们较低的注意力系数来直接限制对抗性边的负面影响。为了优化PA-GNN毒害图,我们设计了一种元优化算法,该算法训练PA-GNN使用清晰图及其对抗性图惩罚扰动,并转移这种能力以提高PA-GNN对毒害图的鲁棒性。四个真实数据集的实验结果证明了PA-GNN对投毒攻击的鲁棒性。

预测研究人员的发表

生产率:分段泊松模型

原文标题:

Predicting publication productivity for researchers: a piecewise Poisson model

地址:

http://arxiv.org/abs/1908.07564

作者:

Zheng Xie

摘要: 预测研究人员的科学生产力是学术管理者和资助机构的基本任务。本研究受研究者出版物数量分布特征的启发,为研究者的出版动态提供了一个模型。它是一个分段泊松模型,通过回归分析和预测研究人员的出版生产率。该模型的原理建立在对非均匀poisson过程(可近似为分段poisson过程)的分布特征的解释上。该模型的原理由高质量的dblp数据集验证,其有效性可用于预测大多数研究人员的出版生产率及其出版生产率的演化趋势。该模型的优点是以一种公正的方式提供结果;因此对于那些通过出版物上的定量指数来评估大量应用程序的资助机构来说是非常有用的。

找到合适的网络规模:

通过谱聚类有效识别因果关系

原文标题:

Finding the right scale of a network: Efficient identification of causal emergence through spectral clustering

地址:

http://arxiv.org/abs/1908.07565

作者:

Ross Griebenow, Brennan Klein, Erik Hoel

摘要: 所有的网络都可以在多个尺度上进行分析。一个更高规模的网络是由宏节点组成的:子图被分组到各个节点中。 在更高的尺度上重建一个网络可以产生有用的效果,例如减少随机游走者在网络中移动的不确定性,同时还减小网络的大小。然而,寻找这样一个宏尺度表示的任务在计算上是困难的,因为网络的所有可能尺度的集合随着节点的数量呈指数增长。在这里,我们比较了各种方法来寻找网络的最大信息规模,发现基于谱分析的方法优于基于贪婪和梯度下降的方法。然后,我们使用此过程来说明优先附着网络的几个结构属性如何在不同尺度上变化。我们描述了网络的中尺度和宏尺度表示相对于其底层的微尺度是如何具有显著的优势的,这些优点包括诸如确定性增加,简并性降低,网络上随机游走者的熵率降低,全球网络效率提高等属性,与微尺度相比,各种中心度量值更高。

遍历Twitter:基于语言的

有效推特账户关注网络采样

原文标题:

Walking Through Twitter: Sampling a Language-Based Follow Network of Influential Twitter Accounts

地址:

http://arxiv.org/abs/1908.07788

作者:

Felix Victor Münch, Ben Thies, Cornelius Puschmann, Axel Bruns

摘要: Twitter通过可公开访问的免费的标准API不断收紧对其数据的访问。这尤其适用于关注者网络。鉴于此,我们成功修改了一种网络抽样方法,以便与Twitter标准API一起高效协同工作,以便检索基于语言的Twitter关注者网络的最核心和最有影响力的帐户:德国推特圈。研究表明,该方法能够在活动、关注者数量、覆盖率和覆盖范围方面接近德国推特圈中有影响力账户的前1%至10%。此外,我们通过展示德国推特圈内部主题社区及其网络结构的第一个概述来证明这些数据的有用性。所提出的数据挖掘方法开辟了进一步的查询途径,例如收集和比较德语以外的基于语言的推特圈,进一步开发围绕某些感兴趣的主题或帐户收集关注者网络及其应用,研究其他在线社交网络和平台。

图聚类可视化的质量度量

原文标题:

A Quality Metric for Visualization of Clusters in Graphs

地址:

http://arxiv.org/abs/1908.07792

作者:

Amyra Meidiana, Seok-Hee Hong, Peter Eades, Daniel Keim

摘要: 传统上,图质量指标侧重于可读性,但最近的研究表明,需要更具体的指标来发现图中的模式。聚类分析是图分析中的一项常见的任务,但是目前还没有一个度量标准明确地量化图的绘制如何表示它的聚类结构。我们设计了一个聚类质量度量来衡量图的节点链接图如何表示图中包含的簇。对变形图形的实验验证了我们的度量可以有效地捕获图形图形视觉簇质量的变化。然后,我们使用我们的度量来检验不同的图绘制算法在不同的图中对集群结构的可视化程度;结果表明,一些经过专门设计以显示集群结构的算法比其他算法表现得更好。

阿拉伯人和无神论:阿拉伯

Twitter空间中的宗教讨论

原文标题:

Arabs and Atheism: Religious Discussions in the Arab Twittersphere

地址:

http://arxiv.org/abs/1908.07811

作者:

Youssef Al Hariri, Walid Magdy, Maria Wolters

摘要: 以前关于无神论的在线讨论的大多数研究都集中在基督教背景下的无神论上。相比之下,关于阿拉伯世界无神论和伊斯兰背景无神论的讨论研究相对较少。另一个复杂的情况是,在一些阿拉伯国家,无神论是违法的,这可能进一步限制无神论者在社交媒体上的活动。在这项工作中,我们探讨了阿拉伯推特圈的无神论讨论。我们根据推特用户发布的内容确定了四类相关的推特用户:无神论者、有神论者、坦韦里(宗教复兴)和其他。我们描述了这四类用户及其社交网络发布的典型内容,特别关注讨论的话题及其互动。我们的研究成果对社会媒体上的宗教和精神话语的研究有一定的启示,并能提供对相关方面更好的跨文化理解。

来源:网络科学研究速递

审校:赵子鸣

编辑:张爽

声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。

近期网络科学论文速递

从动力学角度看网络结构的不确定性 | 网络科学论文速递23篇

非正式导师在学术合作中的作用 | 网络科学论文速递21篇

比特币反洗钱:利用图卷积神经网络进行金融取证试验 | 网络科学论文速递23篇

你的立场暴露了!社交媒体立场检测的可能因素分析 | 网络科学论文速递16篇

如何量化研究城市环境中的不平等 | 网络科学论文速递19篇

加入集智,一起复杂!


集智

集智俱乐部QQ群|877391004

商务合作及投稿转载|swarma@swarma.org

搜索公众号:集智俱乐部

加入“没有围墙的研究所”

集智

让苹果砸得更猛烈些吧!

原文始发于微信公众号(集智俱乐部):集智