集智

心速递

  • 人工蜂群算法中社会交互的表征;

  • 用于局部聚类的热传导核 PageRank 的有效估计;

  • 基于贝叶斯的公共情感建模方法;

  • 符号网络形成博弈和集群平衡;

  • 通过输配水网络中的多尺度反馈环路量化网络弹性;

  • 打击假新闻的开放问题:可解释性机遇;

  • 使用递归神经网络推断振荡系统的动力学;

  • 社交媒体上的热点;

  • 动态网络的拟合优度检验;

  • 含时网络的增量嵌入;

  • 检测 Reddit 上违反宏规范的注释的混合方法;

  • 真或假?用户行为和态度与确定社交媒体帖子的准确性有关;

  • 利用组合传递熵和特征向量中心性分析进行全厂故障和扰动筛选;

  • 城市恐怖主义的共同统计模式;

  • 语境情感分析:网上MeToo故事中人物形象的个案研究;

  • 聪明、负责任和仅限上层种姓:通过对婚姻状况的大规模分析来衡量种姓态度;

  • 分布式无需信任社会技术系统的脆弱性;

人工蜂群算法中社会交互的表征

原文标题:

Characterizing the Social Interactions in the Artificial Bee Colony Algorithm

地址:

http://arxiv.org/abs/1904.04203

作者:

Lydia Taw, Nishant Gurrapadi, Mariana Macedo, Marcos Oliveira, Diego Pinheiro, Carmelo Bastos-Filho, Ronaldo Menezes

摘要:计算群体智能包括多个人工简单代理,在探索搜索空间时交换信息。尽管该领域有丰富的文献,其作品改进了旧方法并提出了新的方法,但复杂行为在这些系统中出现的机制仍然未得到很好的理解。这种文献差距阻碍了研究人员处理群体智能中已知问题的能力,例如早熟收敛,以及代理人之间协调和多样性的平衡。然而,文献中的最新进展已经提出通过网络研究这些系统,该网络来自群体内的社交交互(即,交互网络)。

在我们的工作中,我们提出了人工蜂群(ABC)算法的交互网络的定义。通过我们的方法,我们捕获了该算法的惊人特性。我们揭示了从每种类型的蜜蜂中出现的不同的社会互动模式,揭示了蜜蜂在算法迭代中变化的重要性。我们发现ABC通过使用不同的蜜蜂展示了动态的信息流,但缺乏代理之间的持续协调。

用于局部聚类的热传导

核 PageRank 的有效估计

原文标题:

Efficient Estimation of Heat Kernel PageRank for Local Clustering

地址:

http://arxiv.org/abs/1904.02707

作者:

Renchi Yang, Xiaokui Xiao, Zhewei Wei, Sourav S Bhowmick, Jun Zhao, Rong-Hua Li

摘要:给定无向图G和种子节点s,本地聚类问题旨在识别包含时间大致与群集大小成比例的高质量群集,而不管G的大小。此问题在大型上发现了大量应用-尺度图。最近,热量内核PageRank(HKPR),它是图中节点接近度的度量,适用于这个问题,并发现与现有方法相比更有效。然而,用于计算HKPR的现有解决方案要么过于昂贵,要么对HKPR值提供不令人满意的误差近似,使得它们在十亿边图上尤其不实用。

在本文中,我们提出了TEA和TEA+,两种基于HKPR的新型局部图聚类算法,以解决上述限制。具体而言,这些算法为HKPR值的相对误差和时间复杂度提供了非平凡的理论保证。基本思想是利用确定性图遍历来生成精确HKPR向量的粗略估计,然后利用蒙特卡罗随机遍历以优化和非平凡的方式细化结果。特别是,由于非平凡的优化,TEA+提供了实用的效率和有效性。对现实世界数据集的大量实验表明,在实现相同的聚类质量时,TEA+在大多数基准数据集上的计算时间方面优于最先进的算法超过四倍,特别是一个数量级在大型图表上更快,包括广泛研究的Twitter和Friendster数据集。

基于贝叶斯的公共情感建模方法

原文标题:

A Bayesian-Based Approach for Public Sentiment Modeling

地址:

http://arxiv.org/abs/1904.02846

作者:

Yudi Chen, Qi Wang, Wenying Ji

摘要:公众情绪是有效行动计划成功的直接以公众为中心的指标。尽管其重要性,但在以前的研究中仍未开发出对公众情绪的系统建模。本研究旨在开发一种基于贝叶斯的定量公众情绪建模方法,该方法能够纳入不确定性并指导公众情绪测量的选择。

本研究包括三个步骤:(1)分别用Dirichlet分布和多项分布量化先前的情绪信息和新的情绪观察;(2)通过贝叶斯推理结合Dirichlet分布和多项分布推导出情感概率的后验分布;(3)通过基于应用程序的度量聚合采样的情绪概率集来衡量公众情绪。提供了一个关于HurricaneHarvey的案例研究,以证明所提方法的可行性和适用性。所开发的方法还有可能被推广以模拟各种类型的基于概率的度量。

符号网络形成博弈和集群平衡

原文标题:

Signed Network Formation Games and Clustering Balance

地址:

http://arxiv.org/abs/1904.02902

作者:

Pedro Cisneros-Velarde, Francesco Bullo

摘要:我们提出了一种符号网络形成博弈,其中近视代理动态地和战略性地改变完整网络中边的符号。我们的代理人是社会网络的成员,通过改变他们的人际评估来战略性地减少认知失调。我们描述了该博弈的最佳响应策略,并证明其实现动态地将网络驱动到具有社会意义的标志配置,称为群集平衡。

在该配置中,社会网络中的代理形成一个或多个集群,这些集群在其成员之间具有正关系,但在其他集群的成员之间具有负关系。过去,心理社会学,政治学和物理学领域的各种研究人员都在研究能够解释最多两个星团生成的模型。我们的工作通过提出一个生成更广泛的符号网络类的简单模型来为这些领域做出贡献。

通过输配水网络中的

多尺度反馈环路量化网络弹性

原文标题:

Quantifying Networked Resilience via Multi-Scale Feedback Loops in Water Distribution Networks

地址:

http://arxiv.org/abs/1904.03004

作者:

Alessio Pagani, Fanlin Meng, Guangtao Fu, Mirco Musolesi, Weisi Guo

摘要:输配水网络(WDN)是最重要的人造基础设施之一。弹性,即应对干扰和恢复到理想状态的能力,对我们的社会至关重要。越来越多的证据表明,网络基础设施与动态信号的弹性取决于其网络拓扑特性。虽然现有文献已经研究了各种复杂的网络中心性和谱特性,但很少关注理解基于多尺度流动的反馈回路及其对整体稳定性的影响。

在这里,使用称为营养一致性的代理措施推断出由多尺度反馈回路引起的弹性。据推测,这对压力不足和水龄都有很大的影响。我们的研究结果表明,营养相干性与恢复时间呈正相关(0.62至0.52),而与破坏扩散呈负相关(-0.66至-0.52)。最后,我们应用随机森林分析来结合弹性测量,表明新的弹性集合为网络弹性提供了更准确的度量。

打击假新闻的开放

问题:可解释性机遇

原文标题:

OpenIssuesinCombatingFakeNews:InterpretabilityasanOpportunity

地址:

http://arxiv.org/abs/1904.03016

作者:

Sina Mohseni, Eric Ragan, Xia Hu

摘要:打击假新闻需要各种防御方法。虽然谣言检测和各种语言分析技术是检测社交媒体中虚假内容的常用方法,但还有其他可行的缓解方法可以在机器学习社区中进行探索。在本文中,我们提出了需要进一步关注的假新闻研究中的公开问题和机会。我们首先回顾社交媒体中新闻生命周期的不同阶段,并通过三个例子讨论新闻提要算法在宣传虚假新闻内容时的核心漏洞问题。

然后,我们讨论假新闻问题的复杂性和不清晰性如何限制该领域的进步。最后,我们通过可解释的机器学习提供研究机会,以减轻假新闻问题:1)可解释的假新闻检测和2)透明的新闻提要算法。我们提出了可解释性的三个维度,包括算法可解释性,人类可解释性,以及包含可以以不同方式使假新闻缓解方法受益的支持证据。

使用递归神经网络推

断振荡系统的动力学

原文标题:

Inferring the dynamics of oscillatory systems using recurrent neural networks

地址:

http://arxiv.org/abs/1904.03026

作者:

Rok Cestnik, Markus Abel

摘要:我们研究了递归神经网络对振荡系统的预测能力,不仅对吸引子,而且在其附近。为此,我们考虑受外力扰乱的系统。这使我们不仅可以预测系统的时间演化,还可以研究它的动力学特性,如分岔,动力响应曲线,特征指数等。结果表明即使在状态空间的某些区域也可以有效地估计它们。没有给出输入数据的地方。我们考虑几个不同的振荡例子,包括自持,兴奋,时间延迟和混沌系统。此外,通过统计分析,我们评估了两个常见的复发神经网络细胞,长期短期记忆和门控复发单位的有效推断所需的训练数据量。

社交媒体上的热点

原文标题:

Hot Streaks on Social Media

地址:

http://arxiv.org/abs/1904.03301

作者:

Kiran Garimella, Robert West

摘要:衡量人类表现的影响和成功在各种学科中很常见,包括艺术,科学和体育。量化影响在社交媒体上也起着关键作用,其中影响通常被定义为用户的内容的覆盖范围,如视图,喜欢,转推或分享的数量等指标所捕获。在本文中,我们研究Twitter用户的整个职业生涯,以了解影响的属性。

我们表明用户影响倾向于具有某些特征:首先,影响是按时间聚集的,这样用户的最有影响力的推文看起来彼此接近。其次,用户通常具有影响的“热点”,即延长的高影响力推文。第三,影响倾向于在用户最有影响力的推文之前逐渐积累,然后逐渐消失。我们尝试使用社交媒体上测量的各种属性(包括用户的网络,内容,活动和体验)来解释这些特征,并发现影响的变化与这些属性的重大变化相关联。我们的研究结果为未来的病毒性研究和对社交媒体的影响开辟了有趣的途径。

动态网络的拟合优度检验

原文标题:

Goodness of Fit Testing for Dynamic Networks

地址:

http://arxiv.org/abs/1904.03348

作者:

Abram Magner, Wojciech Szpankowski

摘要:在节点和边进入和离开网络的意义上,现实世界中的许多网络随时间而变化。已经提出各种动态随机图模型来解释这些系统的宏观性质并为统计推断和预测提供基础。有一个严格的方法来确定这些模型与观察到的网络的匹配程度。因此,我们提出以下拟合优度问题:给定一系列随机图的观察/快照以及候选模型M,我们可以确定快照是来自M还是来自某个任意替代模型在一些自然指标中与M完全分开?我们精确地制定了这个问题,并将其归结为图值无限状态马尔可夫过程的拟合度测试,并基于我们称为自然类模型的非平稳采样的过程展示和分析测试。

含时网络的增量嵌入

原文标题:

Incremental embedding for temporal networks

地址:

http://arxiv.org/abs/1904.03423

作者:

Tomasz Kajdanowicz, Kamil Tagowski, Maciej Falkiewicz, Piotr Bielak, Przemysław Kazienko, Nitesh V. Chawla

摘要:对图中的边和节点的预测需要适当且有效地实现的数据表示。最近对动态网络表示学习的研究取得了重大进展。但是,方法越精确和准确,计算和内存的复杂性就越大。在这里,我们介绍ICMEN-一流的增量元嵌入方法,它生成关于图中时间依赖性的节点的向量表示。

ICMEN通过线性凸组合有效地构建节点从历史表示中嵌入,使得该过程比最先进的嵌入算法更少的内存要求。该方法能够构建非活动节点和新节点的表示,而无需重新嵌入。几个真实世界数据集的链路预测结果表明,将ICMEN增量元方法应用于任何基础嵌入方法,我们得到了类似的结果,并节省了内存和计算能力。总之,我们的工作提出了一种在动态复杂网络中进行有效在线表示学习的新方法。

检测 Reddit 上违反宏

规范的注释的混合方法

原文标题:

Hybrid Approaches to Detect Comments Violating Macro Norms on Reddit

地址:

http://arxiv.org/abs/1904.03596

作者:

Eshwar Chandrasekharan, Eric Gilbert

摘要:在此数据集文件中,我们提出了一个三阶段流程来收集Reddit评论,这些评论是由多个子评级的主持人删除评论,因为它违反了subreddit规则和指南。除了主持人因违反社区规范而举报这些评论这一事实外,我们没有任何其他有关违规行为性质的信息。通过使用从Reddit的100个不同社区收集的超过2.8M的评论,我们确定了8个宏规范(即在Reddit的大多数部分广泛实施的规范)。

我们通过采用混合方法(分类,主题建模和开放编码)提取这些宏观规范,在100个研究子目标中至少85个中被认定为规范违规的评论。最后,我们根据违反宏规范的具体类型标记了主持人删除的40K以上的Reddit评论,并使该数据集公开可用。通过将删除的注释集合分解为更细粒度的宏规范违规类型,我们的数据集可用于训练更细微的机器学习分类器以进行在线审核。

真或假?用户行为和态度与

确定社交媒体帖子的准确性有关

原文标题:

RealorFake?UserBehaviorandAttitudesRelatedtoDeterminingtheVeracityofSocialMediaPosts

地址:

http://arxiv.org/abs/1904.03989

作者:

Linda Plotnick, Starr Hiltz, Sukeshini Grandhi, Julie Dugdale

摘要:公民和应急经理需要能够在灾难期间将社交媒体上的“假”(不真实)新闻帖与真实新闻帖区分开来。本文基于2018年进行的一项在线调查,该调查通过电子邮件和Facebook分发了341份回复。它探讨了公民在多大程度上以及如何评估帖子是“真实”还是“假”,并描述了用户希望的内容可信度的指标。

衡量用户尝试验证新闻可信度的频率的语义差异量表的平均响应(从1到0到5的比例)是3.37。公民使用的最常见的消息特征是语法和发送者的可信度。大多数受访者会发现可信度指标很有帮助,最受欢迎的选择是彩色图。讨论了灾害期间可信度评估的局限性和影响。

利用组合传递熵和特征向量中心

性分析进行全厂故障和扰动筛选

原文标题:

Plant-wide fault and disturbance screening using combined transfer entropy and eigenvector centrality analysis

地址:

http://arxiv.org/abs/1904.04035

作者:

Simon Streicher, Carl Sandrock

摘要:在诸如工业化学加工厂之类的复杂系统中找到干扰或故障的来源可能是一项艰巨的任务并且消耗大量的工程时间。在许多情况下,系统消除程序被认为是唯一可行的方法,但可能导致不希望的过程扰乱。从业者需要强有力的替代方法。本文提出了一种无监督的数据驱动方法,用于根据影响的大小和新颖性对过程元素进行排序。部分双变量传递熵估计用于推断过程元素的加权有向图。

应用特征向量中心性来根据网络节点的整体效果对网络节点进行排序。由于流程元素的排名依赖于依赖于许多连接的聚合的新兴属性,因此结果对于单个边属性的估计中的误差以及包含不代表该过程的真正因果结构的间接连接是稳健的。在多个重叠时间区域上连续计算的过程元素重要性分数的监控图表可以帮助初始故障检测。将结果与信息传递网络的视觉检查相结合,对于已知故障和干扰的根本原因分析也是有用的。可以使用所提出方法的软件实现。

城市恐怖主义共同统计模式

原文标题:

Common Statistical Patterns in Urban Terrorism

地址:

http://arxiv.org/abs/1904.04148

作者:

Weisi Guo

摘要:现代恐怖主义背后的根本原因似乎是复杂和无形的。尽管存在多种因果机制,但研究表明,在全球范围内存在可以揭示人类对抗行为的一般统计模式。虽然许多警务和反恐行动是在城市一级进行的,但是缺乏基于统计模式建立城市级决议预测引擎的研究。该文件首次表明,恐怖袭击下的全球城市之间存在普遍共性。通过检查2002年至今全球7000多个城市的30,000多个地理标记的恐怖主义行为,结果显示如下。所有城市都遇到与人口无关的攻击A,并以t的时间间隔分隔负有指数分布的simexp(-A^-1),每次攻击造成死亡人数遵循幂律分布。

预测参数产生很高的置信度,可以解释高达87%的频率变化和89%的死亡收费数据。这些调查结果表明,恐怖袭击的总体统计行为对于所有全球城市来说似乎是随机的,无记忆的。使作者能够开发一个数据驱动的城市特定预测系统,并量化其信息论不确定性和信息丢失。进一步分析表明,攻击可预测性的不确定性似乎有所增加,这对我们发展有效反恐能力的能力提出了挑战。

语境情感分析:网上MeToo

故事中人物形象的个案研究

原文标题:

ContextualAffectiveAnalysis:ACaseStudyofPeoplePortrayalsinOnlineMeTooStories

地址:

http://arxiv.org/abs/1904.04164

作者:

Anjalie Field, Gayatri Bhat, Yulia Tsvetkov

摘要:2017年10月,许多女性指责制片人HarveyWeinstein遭受性骚扰。他们的故事鼓励其他女性对包括政治家,演员和制片人在内的许多知名人士发出性骚扰指控。这些事件被广泛称为MeToo运动,其名称是在Twitter和Facebook等社交媒体平台上使用标签“metoo”。这一运动被广泛称为“赋权”,因为它扩大了以前闻所未闻的女性的声音,而不是传统上强大的男性。

在这项工作中,我们调查了这些事件的在线媒体报道中的情绪,权力和代理的动态。使用关于MeToo运动的在线媒体文章语料库,我们提出了一种情境中的情感分析-一种以实体为中心的方法,它使用情境化词典来检查媒体文章中人物的描绘方式。我们表明,尽管这些文章对遭受过性骚扰的女性表示同情,但即使在性侵犯指控之后,她们也始终将男性视为最强大的。虽然我们专注于MeToo运动的媒体报道,但我们的情境情感分析方法很容易推广到其他领域。

聪明、负责任和仅限上

层种姓:通过对婚姻状况

的大规模分析来衡量种姓态度

原文标题:

Smart,Responsible,andUpperCasteOnly:MeasuringCasteAttitudesthroughLarge-ScaleAnalysisofMatrimonialProfiles

地址:

http://arxiv.org/abs/1904.04176

作者:

Ashwin Rajadesingan, Ramaswami Mahalingam, David Jurgens

摘要:歧视性的种姓态度目前使数百万印度人蒙羞,使个人在生活的各个方面受到偏见。政府的激励措施和社会运动试图对抗这些态度,但尚无法准确衡量公众对种姓的看法,无法了解是否正在取得进展。在这里,我们介绍了一种通过指标变量衡量公众对种姓态度的新方法:对婚姻的开放性。我们使用来自印度主要婚姻场所的超过313,000个剖面的大量数据集,精确地量化了公众的态度,以及世代之间以及印度居民和侨民之间的差异。

我们表明,年轻一代对婚姻中的婚姻更加开放,但态度的基础是社会地位超越自己种姓的复杂功能。在研究配偶所期望的品质时,我们发现对性别婚姻开放的个体在他们所渴望的品质上更具个人主义性,而不是偏爱与家庭有关的品质,这反映了更大的社会趋势,远离集体主义。最后,我们表明侨民的态度明显不那么开放,这表明了一体化的双文化模式。我们的研究提供了第一个经验证据,证明了身份的各种交叉点如何塑造了印度和美国印度侨民对种姓婚姻的态度。

分布式无需信任社

会技术系统的脆弱性

原文标题:

The fragility of decentralised trustless socio-technical systems

地址:

http://arxiv.org/abs/1904.04192

作者:

Manlio De Domenico, Andrea Baronchelli

摘要:区块链技术有望改变金融,金钱甚至政府。然而,区块链适用性和稳健性的分析通常集中在孤立的系统上,这些系统的参与者主要通过运行一致性算法来做出贡献。在这里,我们强调在包括社交和通信网络在内的更广泛的生态系统中考虑无信任平台的重要性。作为一个例子,我们分析了2017年6月21日在以太坊平台上观察到的闪电崩溃,并表明社会协调的一个主要现象导致了几个互连系统中的灾难级联事件。

我们提出“紧急集中化”的概念来描述单个系统对整个生态系统的运作至关重要的情况,并认为这种情况在相互关联的社会技术系统中可能会变得越来越频繁。我们预计,我们提出的系统方法将对未来对无信任系统的评估产生影响,并要求决策者注意我们相互关联和迅速变化的世界的脆弱性。

来源:网络科学研究速递

编辑:孟婕

声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客https://www.complexly.me(提供RSS订阅)进行同步更新。

近期网络科学论文速递

人类社会演化的动力学:一种能量学方法等12篇

提高推荐系统长期性能的新方法 等16篇

使用深度神经网络对 Twitter进行威胁检测 等16篇

解开狗行为中的语言模式 等9篇

对科学的消极态度源于过度自信 等17篇

社区检测的精确“没有免费午餐”定理 等14篇

加入集智,一起复杂!


集智

集智俱乐部QQ群|877391004

商务合作及投稿转载|swarma@swarma.org

搜索公众号:集智俱乐部

加入“没有围墙的研究所”

集智

让苹果砸得更猛烈些吧!

原文始发于微信公众号(集智俱乐部):集智