集智

核心速递

  • 图中心性是一个尺度问题;

  • 用于交通的动力学模型的BGK近似;

  • 复杂网络中的有偏随机搜索;

  • 人类数字痕迹的总误差框架;

  • 带有循环的网络上的消息传递;

  • 我和你站在一起:用Emoji表情研究危机事件中的团结;

  • 网络持续同调:方法与应用;

  • 主动-被动行人动力学的格子模型:探索漂移效应;

  • 人口或密度变化对城市二氧化碳排放的影响;

  • 基于链接划分和围绕中心点划分的网络重叠社区检测;

  • 通过中心加权抽样改进基于Skip-Gram的图嵌入;

  • 网络上传染病模型的自适应易感性和异构性;

  • 检测社交媒体中的网络欺凌和网络攻击;

  • 基于谱的有向图图卷积网络;

  • 对Twitter趋势主题的综合分析;

  • 使用LSTM的基于文献的知识发现预测框架;

  • Trusses和Trapezes:社会网络中易于解释的社区;

图中心性是一个尺度问题

原文标题:

Graph centrality is a question of scale

地址:

http://arxiv.org/abs/1907.08624

作者:

Alexis Arnaudon, Robert L. Peach, Mauricio Barahona

摘要:图中心性的经典度量捕获节点重要性的不同方面,从局部(例如,”度”)到全局(例如,“接近度”)。在这里,我们利用扩散和几何之间的联系来引入多尺度中心度度量。如果节点由于图中的有效边界和不均匀性而破坏了扩散的度量,则将节点定义为“中心”。我们的度量自然是多尺度的,因为它是在扩散的变化时间范围内相对于图邻域计算的。我们发现节点的中心性在不同的尺度上可以有很大的不同。特别是,我们的测量与小尺度的程度(即集线器)和大尺度的接近程度(即桥梁)相关,并且还揭示了复杂网络中多中心结构的存在。通过检查跨尺度的中心性,我们的度量因此提供了相对于网络上的本地和全局过程的节点重要性的评估。

用于交通网络动力

学建模的BGK近似

原文标题:

The BGK approximation of kinetic models for traffic

地址:

http://arxiv.org/abs/1812.11056

作者:

Michael Herty, Gabriella Puppo, Sebastiano Roncoroni, Giuseppe Visconti

摘要:我们研究了车辆交通流的空间非均匀动力学模型。经典公式,例如BGK方程在拥挤的交通方式中会导致无条件不稳定的解决方案。我们通过推导改进的BGK型方程公式来解决这个问题。新的动力学模型允许在交通流中再现条件稳定的非平衡现象。特别地,在模型不稳定的密度的有界区域中出现有界向后传播信号的停止和去波。这里介绍的BGK型模型还提供了微观跟随领导者模型和宏观Aw-Rascle和Zhang模型之间的介观描述。

复杂网络中的有偏随机搜索

原文标题:

Biased Random Search in Complex Networks

地址:

http://arxiv.org/abs/1907.08222

作者:

Lasko Basnarkov, Miroslav Mirchev, Ljupco Kocarev

摘要:我们研究了两种基于局部信息的复杂网络上的偏向随机游走。在第一过程中,有利于向具有较小度数的相邻节点的过渡,而在第二过程中,探索基于两跳邻域的另一概念。我们通过数值模拟验证了这两个程序都减少了目标的平均搜索时间。我们在理论上表明,对于连接良好的网络,其中节点具有许多邻居,基于节点度的逆的随机游走的偏差导致对无向和有向网络的近似最优搜索。

为人类数字轨迹推理

设计的全误差框架

原文标题:

A Total Error Framework for Digital Traces of Humans

地址:

http://arxiv.org/abs/1907.08228

作者:

Indira Sen, Fabian Floeck, Katrin Weller, Bernd Weiss, Claudia Wagner

摘要:全世界数亿人的互动和活动每天都被记录为数字痕迹。这些数据汇集在一起时,可以提供越来越全面的在不同平台上交互的个人和群体的侧写,这些数们也可以推断出超出这些平台的更广泛的目标群体,代表了社会科学的巨大潜力。尽管数字痕迹具有许多优点,但最近的研究已经开始讨论当数字痕迹用于了解人类和社会现象时可能发生的偏差。顺便提一下,许多类似的错误也会影响调查估计,调查设计人员几十年来一直使用错误概念化的框架,如全面普查。在这项工作中,我们提出了一个新概念框架,用于诊断、理解和避免在基于人类数字痕迹的研究中可能出现的错误,这些研究利用了全面调查误差框架的系统方法。

带有循环的网络消息传递

原文标题:

Message passing on networks with loops

地址:

http://arxiv.org/abs/1907.08252

作者:

George T. Cantwell, M. E. J. Newman

摘要:在本文中,我们为网络研究中的一项长期问题提供了解决方案。消息传递是网络和图计算的基本技术。该方法的第一个版本出现在20世纪30年代,几十年来它已应用于数学,物理学,计算机科学,统计学和机器学习中的广泛基础问题,包括贝叶斯推理,自旋模型,着色,可满足性,图分区,网络流行病学和矩阵特征值的计算。然而,尽管它被广泛使用,但人们早就认识到该方法有一个根本的缺陷:它只适用于没有短循环的网络。循环的存在引入了相关性,导致该方法最多给出不准确的答案,并在最坏的情况下完全失败。不幸的是,几乎所有现实世界的网络都包含许多短循环,这限制了消息传递方法的有用性。在本文中,我们将演示如何纠正这个缺点并创建适用于任何网络的消息传递方法。我们给出两个示例应用,一个用于网络的渗透属性,另一个用于计算稀疏矩阵的谱。

我支持你:用Emoji表情

研究危机事件中的团结

原文标题:

I Stand With You: Using Emojis to Study Solidarity in Crisis Events

地址:

http://arxiv.org/abs/1907.08326

作者:

Sashank Santhanam, Vidhushini Srinivasan, Shaina Glass, Samira Shaikh

摘要:我们研究了在两个重大危机事件与自然灾害:2017年飓风Irma和2015年11月巴黎发生的恐怖袭击事件的背景下,人们如何运用表情符号来表达社交团结。我们使用带注释的语料库,我们首先训练一个递归神经网络模型来对文本中的团结表达进行分类。接下来,我们使用这些团结表达来表征在线社会网络中的人类行为,我们通过表情符号基于的是时间和地理空间的扩散。我们的分析表明,当危机事件展开时,表情符号的广泛使用是社会媒体行为(团结)背后的有力指标。

网络持续同调:方法与应用

原文标题:

Persistence Homology of Networks: Methods and Applications

地址:

http://arxiv.org/abs/1907.08708

作者:

Mehmet Emin Aktas, Esra Akbas, Ahmed El Fatmaoui

摘要:出于捕捉各种学科的复杂关系的目的,信息网络越来越收到人们的重视。例如社会网络、引文网络、生物网络等。该领域的主要困难是基于拓扑测量网络之间的相似性或距离。然而,经典的图论理论测量通常是局部的,主要基于节点或边测量或相关性之间的差异,而不考虑诸如连接的组件或孔之类的网络的拓扑。近年来,基于数学工具和基于深度学习的方法已经变得流行以提取网络的拓扑特征。持久同源性(PH)是计算拓扑中的一种数学工具,用于测量数据的拓扑特征,这些特征在多个规模上持续存在,应用范围从生物网络到社会网络。在本文中,我们提供了在复杂网络科学中使用PH的这一领域的关键进展的概念性回顾。我们给出了关于PH的简要数学背景,回顾了不同的方法(即过滤)以在网络上定义PH并突出显示不同的算法和应用,其中PH用于解决网络挖掘问题。在这样做的过程中,我们开发了一个统一的框架来描述这些最近的方法,并强调主要的概念区别。我们总结了未来工作的方向。我们将重点放在最近的方法上,这些方法在从事网络数据工作的数学和数据挖掘社区得到了极大的关注。我们相信,我们对网络上PH分析的总结将为应用网络科学研究人员提供重要的见解。

主动-被动行人动力学

的格状模型:探索漂移效应

原文标题:

A lattice model for active—passive pedestrian dynamics: a quest for drafting effects

地址:

http://arxiv.org/abs/1907.08621

作者:

Emilio N. M. Cirillo, Matteo Colangeli, Adrian Muntean, T. K. Thoa Thieu

摘要:我们使用晶格气体模型研究了具有两种粒子的从一条不起眼的走廊逃离的行人。一种称为“被动”的物种在晶格上执行对称随机游走,而第二物种被称为“主动”的物种收到漂移效应的影响,引导粒子朝向出口。漂移效应模仿了一些行人对走廊几何形状和出口位置的认识。我们提供的数值证据表明,尽管颗粒之间存在硬核相互作用,就是说每个部位最多可存在一个任何物种的颗粒,在系统中添加一部分活性颗粒可提高所有颗粒的疏散率。当观察出射粒子通量时,当系统与引起稳态开始的外部粒子储存器接触时,也观察到类似的效果。我们将这种现象解释为通常在连续体设置中观察到的牵伸效应的离散空间对应物,即可类比自行车选手竞赛经历的空气动力阻力。

人口或密度变化对城市

二氧化碳排放的影响

原文标题:

Effects of changing population or density on urban carbon dioxide emissions

地址:

http://arxiv.org/abs/1907.08623

作者:

Haroldo V. Ribeiro, Diego Rybski, Jürgen P. Kropp

摘要:城市化是否有助于增加二氧化碳排放的问题主要通过在不同城市之间寻找更大的人口或人口密度的关系来研究。然而,这些方法忽略了人口与面积之间的相关性,忽略了这些量之间可能的相互作用。在这里,我们提出了一个广义框架,同时考虑人口和面积的影响以及这些城市指标之间可能的相互作用。我们的研究结果显著改善了排放的描述,揭示了人口与密度之间在排放方面的耦合作用。这些模型表明,与人口或密度的比例变化相关的排放变化可能不仅取决于这些变化的大小,还取决于这些变化的初始值。对于美国地区,城市越大,其人口或密度的变化对其排放的影响就越大;但人口变化对排放的影响总是大于人口密度。

基于链接划分与中心点

划分的网络重叠社区检测

原文标题:
Overlapping community detection in networks based on link partitioning and partitioning around medoids
地址:
http://arxiv.org/abs/1907.08731
作者:
Alexander Ponomarenko, Leonidas Pitsoulis, Marat Shamshetdinov
摘要: 在本文中,我们提出了一种新方法,用于检测具有预定义数量的聚类的网络中的重叠社区。图中的重叠社区是通过链接分区和围绕中心分区来检测相关线图中的不相交社区而获得的。通过使用在线性图的节点集上定义的距离函数来完成对中间体的分区。在本文中,我们将通勤(commute )距离和放大的通勤距离视为距离函数。通过对现实实例的计算实验证明了所提出方法的性能。

通过中心加权抽样改进

基于Skip-Gram的图嵌入

原文标题:

Improving Skip-Gram based Graph Embeddings via Centrality-Weighted Sampling

地址:

http://arxiv.org/abs/1907.08793

作者:

Pedro Almagro-Blanco, Fernando Sancho-Caparrini

摘要:受word2vec启发的网络嵌入技术代表了一种有效的无监督关系学习模型。通常,通过Skip-Gram过程,这些技术通过采样节点上下文示例来学习图中节点的低维矢量表示。尽管目前已经提出了许多对节点的上下文进行采样的方法,但是没有深入分析选择节点的方式的影响。为了填补这一空白,我们在同一框架下重新实现了主要的四个word2vec启发图嵌入技术,并分析了在节点分类问题中测试时不同的采样分布如何影响嵌入性能。我们在不同的众所周知的真实数据集上展示了一组实验,展示了在采样中使用流行的中心性分布如何导致效益的提升,学习时间不变的条件内获得高达2倍的速度以及在所有情况下提高准确性。

网络上传染病模型

的自适应易感性和异构性

原文标题:

Adaptive Susceptibility and Heterogeneity in Contagion Models on Networks

地址:

http://arxiv.org/abs/1907.08829

作者:

Renato Pagliara, Naomi E. Leonard

摘要:传染病,社会行为或计算机病毒的传播等传染过程会影响生物,社会和技术系统。用于大群体和网络上有限群体的流行病模型已被用于理解和控制瞬态和稳态行为。通常,假设在从感染恢复后,每个药剂将返回其原始易感状态或获得对再感染的完全免疫。我们研究了网络上的SIRI(即易感染-感染-恢复-感染)模型,这是一种流行病模型,用于在异构药物网络上传播传染过程,可以调整其对再感染的易感性。该模型推广现有模型以适应现实条件,其中药剂在首次暴露于感染后获得部分或受损的免疫力。我们证明了模型参数和网络结构的必要和充分条件,它们区分了四种动态机制:无感染,流行,中心性和双稳态。对于传统模型中未考虑的双稳态体制,我们展示了在看似收敛于无感染人群之后如何迅速复苏的流行病。我们使用该模型及其预测能力来展示如何设计控制策略以减轻有问题的传染行为。

检测社交媒体中的

网络欺凌和网络攻击

原文标题:

Detecting Cyberbullying and Cyberaggression in Social Media

地址:

http://arxiv.org/abs/1907.08873

作者:

Despoina Chatzakou, Ilias Leontiadis, Jeremy Blackburn, Emiliano De Cristofaro, Gianluca Stringhini, Athena Vakali, Nicolas Kourtellis

摘要:网络欺凌和网络攻击是越来越令人担忧的现象,影响着所有地区的人。全球超过一半的年轻社交媒体用户遭受过长时间和/或联合的数字化骚扰。受害者可以体验各种各样的情绪,带来诸如尴尬,抑郁,与其他社区成员隔离等负面后果,这些后果会导致风险导致更严重的后果,例如自杀未遂。在这项工作中,我们采取了第一个具体步骤,以了解Twitter,这是当今最大的社交媒体平台之一的滥用行为的特征。我们分析了120万用户和210万条推文,将参与围绕看似正常主题的讨论的用户与那些更可能与仇恨有关的用户进行比较,例如Gamergate争议,或BBC电视台的两性同工不同酬现象。我们还在其中一个与仇恨有关的社区(Gamergate)中探讨了网络暴力行为的具体表现,即网络欺凌和网络犯罪。我们提出了一种强大的方法,通过考虑文本,用户和基于网络的属性来区分恶霸和攻击者与普通Twitter用户。使用各种最先进的机器学习算法,我们将这些帐户分类为90%以上的准确度和AUC。最后,我们讨论了我们的方法标记为滥用的Twitter用户帐户的当前状态,并研究了Twitter可用于将来暂停用户的潜在机制的性能。

基于谱的有向图图卷积网络

原文标题:

Spectral-based Graph Convolutional Network for Directed Graphs

地址:

http://arxiv.org/abs/1907.08990

作者:

Yi Ma, Jianye Hao, Yaodong Yang, Han Li, Junqi Jin, Guangyong Chen

摘要:图卷积网络(GCN)已成为当今最流行的图数据方法,因为它们具有从图中提取特征的强大能力。GCNs方法分为两类,基于谱和基于空间。作为最早的图数据卷积网络,基于谱的GCN在许多图相关的分析任务中取得了令人瞩目的成果。然而,基于谱的模型不能直接在有向图上工作。在本文中,我们通过利用重新定义的拉普拉斯算子来改进其传播模型,为有向图提出了一种改进的基于谱的GCN。我们的方法可以直接在半监督节点分类任务中的有向图数据上工作。在许多有向图数据集上的实验表明,我们的方法优于最先进的方法。

对Twitter趋势主题的综合分析

原文标题:

A Comprehensive Analysis of Twitter Trending Topics

地址:

http://arxiv.org/abs/1907.09007

作者:

Issa Annamoradnejad, Jafar Habibi

摘要:Twitter是最常用的微博和在线社会网络服务之一。在Twitter中,以比其他项更高频率提及的名称,短语或主题称为“趋势主题”或简称为“趋势”。推特趋势在许多公共活动,选举和市场变化中表现出了强大的能力。然而,很少有工作重点是了解这些趋势主题的动态。在本文中,我们彻底检查了Twitter的2018年趋势主题。为此,我们访问了2018年全年的Twitter趋势API,并设计了六个标准来分析我们的数据集。这六个标准是:词汇分析,到达时间,趋势再现,趋势时间,推文数量和语言分析。除了提供有关每个标准的一般统计数据和最热门主题之外,我们还计算了几个可解释大量数据的分布。

使用LSTM的基于文献

的知识发现预测框架

原文标题:

Towards an LSTM-based Predictive Framework for Literature-based Knowledge Discovery

地址:

http://arxiv.org/abs/1907.09395

作者:

Nazim Choudhury, Fahim Faisal, Matloob Khushi

摘要:基于文献的知识发现识别过程是用来识别文献中嵌入的信息之间的重要但未明确的关系的。来自信息检索和自然语言处理的现有技术试图识别已发表文献中信息概念之间隐藏或未发表的联系,然而,这些技术破坏了预测未来的概念以及文献中包含的科学知识组件之间的新兴关系。基于作者选择的关键词(即知识实体)构建的关键词共现网络(KCN)被认为是通过检查知识实体之间的关系而集中于这些知识组件和科学领域的知识结构的知识图。利用来自医学领域以外的两个多学科研究领域的数据,利用文献计量学,时间KCN的动态性和长期短期记忆复发神经网络,本研究提出了一个成功预测未来基于文献的发现的新框架-新兴知识单位之间的联系。本研究将问题框定为动态监督链路预测任务,所提出的框架集成了一些新颖的节点和边级特征。从二分网络和单网络计算关键词的时间重要性,基于家谱关系的关键词社区,以及在特征构建过程中使用的时间引用计数的相对重要性。节点和边级功能都输入到LSTM网络中,以预测正负标记的非连接关键字对的特征值,并对其进行准确分类。高分类绩效率表明,这些特征在预测科学知识单元之间新兴的联系和新兴趋势分析方面都具有支持作用。

Trusses and Trapezes:

社会网络中易解释的社区

原文标题:

Trusses and Trapezes: Easily-Interpreted Communities in Social Networks

地址:

http://arxiv.org/abs/1907.09417

作者:

Jonathan D. Cohen

摘要:Trusses是基于三角形的团放松手段,它用于以易于解释且具有计算吸引力的方式识别个体组成的群体。本文介绍了基于4循环,相对于Trusses的,被称为Trapezes,提出了Trusses和Trapezes的加权延伸,并提供了强Trusses和Trapezes以及Trusses和Trapezes的改进。Trapezes图的使用允许我们对二部图进行应用,而加权版本允许由于自然边加权而使得支持而不增加计算复杂度。最后,强大和顶端版本可以在不同密度的图中轻松确定社区。这些结构中的每一个都在多项式时间内提供有保证的计算,这种假设由自然观察到的社会凝聚现象产生,并且与其他标准结构很好地关联。

来源:网络科学研究速递

审校:陈曦

编辑:张爽

声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。

近期网络科学论文速递

计算人类动力学 | 网络科学论文速递23篇

社交机器人造成的信息污染 | 网络科学论文速递18篇

时间序列背后的统计力学 | 网络科学论文速递17篇

通过移动数据了解在线新闻消费模式 等9篇

比特币网络的污点分析 等14篇

加入集智,一起复杂!


集智

集智俱乐部QQ群|877391004

商务合作及投稿转载|swarma@swarma.org

搜索公众号:集智俱乐部

加入“没有围墙的研究所”

集智

让苹果砸得更猛烈些吧!

原文始发于微信公众号(集智俱乐部):集智