集智斑图最新论文栏目,关注复杂系统、网络科学、计算社会科学、统计物理等领域的前沿进展,每天即时更新相关顶刊论文,和最新arXiv预印本论文。
本文是对近期arXiv论文的汇总编译(by 彩云小译)。更多最新论文,请扫二维码获取。
-
以貌取人: 面部知觉对社交网络中心性的影响;
-
不完全信息下多智能体协作的联合策略搜索;
-
多主体深度强化学习在车辆云网络中启用计算资源分配;
-
化学混沌中产生熵的随机方法;
-
网络过滤统计资料;
-
视频游戏中颗粒介质的概率元胞自动机;
-
基于图神经网络的洛伦兹增强玻色子监督射流聚类;
-
使用稀有数据学习: 使用主动重要性抽样优化稀有事件主导的目标;
-
ALONE:推特上青少年有害行为的数据集;
-
基于 BERT 模型的社交媒体仇恨言论检测与种族偏见缓解;
-
MILE:可扩展图嵌入的多层次框架;
-
一种尺寸并不适用于所有的情况: Stack Overflow 中的徽章行为研究;
-
Exo-SIR: 分析印度新冠肺炎外源感染影响的流行病学模型;
-
利用流动性数据绘制新冠肺炎暴发的风险地图;
-
基于大规模旅行数据集的网约车旅行深入分析;
-
传播网络的空间随机 SIR 模型及其在中国新冠肺炎流行病中的应用;
-
新冠肺炎在人群中传播动态的经验模型;
-
DINE:一种深度不完全网络嵌入框架;
Judging a Book by Its Cover: The Effect of Facial Perception on Centrality in Social Networks
地址:
http://arxiv.org/abs/2008.06312
Dongyu Zhang,Teng Guo,Hanxiao Pan,Jie Hou,Zhitao Feng,Liang Yang,Hongfei Lin,Feng Xia
摘要:在社交网络中,面部表情很重要。个体经常根据面部线索做出特质判断。虽然这些基于面部表情的印象缺乏证据来确定其有效性,但它们至关重要,因为它们可能与基于人际网络的社会行为有关,例如寻求某些个人的帮助、建议、约会和合作,因此它们可能与社会网络中的中心性有关。然而,对于影响网络中心性的表观面部特征的研究很少甚至没有,尽管对于中心位置归因的研究很多,包括人格和行为。本研究以大学一年级学生为研究对象,通过对大学一年级学生社会网络形成的初始阶段的研究,考察了基于面部表情的知觉特征是否影响网络中心性。我们给住在同一住宅区的新生参与者拍了面部照片,然后要求他们提名连接到不同网络的社区成员。然后,我们通过要求其他参与者根据三个主要属性对面部图像进行评分来收集面部感知数据: 支配性、可信度和吸引力。同时,我们提出了一个框架来发现面部表情是如何影响社交网络的。我们的研究结果表明,人们的面部特征知觉与网络中心性有关,它们可以预测不同网络中人们的中心性。我们的研究结果为面孔和网络中心性之间的相互作用提供了心理学证据。我们的研究结果也为心理学和社会网络技术的结合提供了见解,他们强调了面部偏见在提示线索和传递社会特征方面的作用。据我们所知,我们是第一个探讨面部感知对社会网络中心性的影响。
Joint Policy Search for Multi-agent Collaboration with Imperfect Information
地址:
http://arxiv.org/abs/2008.06495
Yuandong Tian,Qucheng Gong,Tina Jiang
摘要:在不完全信息的情况下,学习好的多智能体协作的联合策略仍然是一个根本性的挑战。对于两人零和博弈,坐标上升方法(每次优化一个代理的策略,例如,自我扮演)与保证一起工作,在多代理合作的设置中,它们经常收敛到次优的纳什均衡点。另一方面,由于政策之间复杂的相互作用(例如,上游更新影响下游状态的可达性) ,在不完全信息博弈中直接对联合政策变化进行建模是非常重要的。本文提出了一种新的策略变化密度概念,将博弈值的全局变化分解为每个信息集上的策略变化。在此基础上,我们提出了联合策略搜索(JPS) ,在不完全信息博弈中迭代地改进协同代理的联合策略,而不需要重新评估整个博弈。在多智能体协作表格游戏中,JPS 被证明永远不会降低性能,并且可以改进单方面方法(例如 CFR)提供的解决方案,这些方法的性能优于为协作策略学习设计的算法(例如 BAD)。此外,对于真实世界的游戏,JPS 有一个在线形式,自然与梯度更新链接。我们将其测试到“合同桥梁”上,这是一个4人的不完全信息游戏,其中一个2人的团队将与另一个团队进行竞争。在投标阶段,参与者依次通过有限的信息渠道投标以寻求一份好的合同。基于一个强大的基线代理,纯粹通过领域不可知的自我发挥来投标竞争性桥梁,JPS 改善了团队成员之间的协作,并且超过了赢得冠军的软件 WBridge5,超过1000场比赛,每局获得 + 0.63 imp (国际匹配点) ,大大优于以前的 SoTA (+ 0.41 imp/b)。注意,+ 0.1 imp/b 被认为是计算机桥的一个重大改进。
多主体深度强化学习
在车辆云网络中启用计算资源分配
Multi-Agent Deep Reinforcement Learning enabled Computation Resource Allocation in a Vehicular Cloud Network
地址:
https://arxiv.org/abs/2008.06464
Shilin Xu,Caili Guo,Rose Qingyang Hu,Yi Qian
摘要:在本文中,我们研究了没有集中基础设施支持的分布式 Ad-Hoc 车辆网络中的计算资源分配问题。为了满足这样一个车辆网络中不断增长的计算需求,我们构建了分布式虚拟云网络(VCN) ,在此基础上,我们提出了一种通过在附近车辆之间卸载来实现计算资源共享的方案。针对 VCN 中的时变计算资源,详细分析了计算资源的统计分布特性。因此,提出了一种资源感知的组合优化/目标机制。为了缓解 VCN 典型的多 agent 环境造成的非平稳环境,我们采用了集中训练和分散执行框架。此外,对于目标最佳化问题,我们将其建模为一个 Markov 博弈,并提出了一个基于 DRL 的多智能体深度确定性强化学习算法(MADDPG)来解决它。有趣的是,为了克服 VCN 中缺少真正的中央控制单元的困境,分配实际上是以分布式的方式在车辆上完成的。仿真结果证明了该方案的有效性。
Stochastic approach to entropy production in chemical chaos
地址:
http://arxiv.org/abs/2008.06437
摘要:提出了在随机反应系统中计算产生熵的方法。这些方法被证明与非平衡化学热力学的已知结果是一致的。此外,还证明了在随机过程和确定性系统中,产生熵的时间平均可分解为由化学计量矩阵得到的循环的贡献。将这些方法应用于基于罗斯勒回注原理构造的具有化学混沌特征的复杂反应网络。
Filtering Statistics on Networks
地址:
http://arxiv.org/abs/2008.06383
G. J. Baxter,R. A. da Costa,S. N. Dorogovtsev,J. F. F. Mendes
摘要:作为复杂系统中信息处理的一个易于处理的简单例子,我们探讨了在一些确定性和随机图上过滤简单模式的统计方法。在这个问题中,多个输入映射到同一个输出,滤波的统计量表示为这种简并度的分布。对于一个环上的几个简单的滤波器模式,我们得到了问题的精确解,并用数值方法描述了更困难的滤波器设置。对于每个过滤器模式和网络,我们找到一些数字本质上描述了过滤的统计,并对不同的网络进行了比较。对于不同结构的网络,我们的结果似乎基本上由两个因素决定: 图的结构是确定的还是随机的,以及顶点度。我们发现在随机图中进行滤波比在确定性图中产生更丰富的统计信息。这种统计丰富性是通过增加图的度来减少的。
Probabilistic Cellular Automata for Granular Media in Video Games
地址:
http://arxiv.org/abs/2008.06341
Jonathan Devlin,Micah D. Schuster
摘要:粒状材料在日常生活中非常普遍。沙子、土壤、砾石、食品、药品等介质都是由大量的固体小颗粒组成,具有相似的不规则流动。在电子游戏中,模拟这些材料可以增加沉浸感,并可用于各种游戏机制。计算上,全面的模拟通常是不可行的,除非在最强大的硬件和往往减少优先权,以有利于其他,更加完整的,游戏性的特点。在这里,我们研究的计算和定性方面的沙粒侧剖面流使用细胞自动机(CA)。我们的 CA 使用一个标准的正方形格子,通过一个自定义的、修改过的 Margolus 邻居来更新。每次更新都使用一组概率跃迁,可以调整这些跃迁来模拟粒子之间的摩擦。我们重点关注沙漏结构的外观创建一个沙漏形状随着时间的推移使用不同的过渡概率和这样一个模拟的计算影响。
Supervised Jet Clustering with Graph Neural Networks for Lorentz Boosted Bosons
地址:
http://arxiv.org/abs/2008.06064
Xiangyang Ju,Benjamin Nachman
摘要:射流聚集传统上是一个非监督式学习任务,因为没有独特的方式将强子末态与产生它们的夸克和胶子自由度联系起来。然而,对于像 w,z,和 Higgs 玻色子这样的无色粒子,精确地(虽然不完全)将最终态强子与它们的祖先联系起来是可能的。通过将模拟的最终态强子标记为从未着色的粒子下降,可以训练一种监督式学习方法来学习制造玻色子喷流。这种方法主要是对单个粒子进行操作,并确定来自同一个未着色粒子的粒子之间的联系。图形神经网络非常适合于这个目的,因为它们可以作用于无序集合,并且自然地在具有相同标签的粒子之间创建强大的连接。这些网络被用来训练一个有监督的喷流聚类算法。这些图形射流的运动学特性与模拟洛伦兹增强 w 玻色子的运动学特性更加吻合。此外,图中的喷流包含了更多的信息来区分 w 喷流和普通夸克喷流。这项工作标志着在喷气物理学中一个新的探索的开始,使用机器学习来优化喷气机的结构,而不仅仅是从喷气成分中计算出来的可观测量。
使用稀有数据学习:
使用主动重要性抽样
优化稀有事件主导的目标
Learning with rare data: Using active importance sampling to optimize objectives dominated by rare events
地址:
http://arxiv.org/abs/2008.06334
Grant M. Rotskoff,Eric Vanden-Eijnden
摘要:深度神经网络,当优化有足够的数据时,提供了高维函数的精确表示; 相比之下,在科学计算中占主导地位的函数逼近技术不能很好地按维度进行伸缩。因此,许多高维抽样和近似问题一度被认为是难以解决的重新透过机器学习的镜头。虽然承诺无与伦比的准确性可能意味着需要参数化复杂系统表示的应用程序的复兴,但在许多应用程序中,收集足够的数据来开发这种表示仍然是一个重大挑战。在这里,我们介绍了一种方法,结合稀有事件抽样技术和神经网络优化目标函数的优化是稀有事件为主。我们证明了重要性抽样减少了学习问题解的渐近方差,显示了泛化的好处。我们在学习一个系统的两个状态之间的动态转换路径的背景下研究我们的算法,这个问题在统计物理学和机器学习理论中都有应用。我们的数值实验表明,即使在高维数据和稀疏数据的复合困难下,我们也可以成功地进行学习。
ALONE: A Dataset for Toxic Behavior among Adolescents on Twitter
地址:
http://arxiv.org/abs/2008.06465
Thilini Wijesiriwardene,Hale Inan,Ugur Kursuncu,Manas Gaur,Valerie L. Shalin,Krishnaprasad Thirunarayan,Amit Sheth,I. Budak Arpinar
摘要:社交媒体的便利性也助长了它的滥用,可能导致有害的行为。近66% 的互联网用户观察到过网络骚扰,41% 声称有过个人经历,18% 面临严重的网络骚扰。这种有害的交流对年轻人的幸福有着重大的影响,影响着他们的心理健康,在某些情况下甚至导致自杀。这些交际具有复杂的语言特征和语境特征,使得对这些叙事的识别具有挑战性。在这篇论文中,我们提供了一个多模式的社会媒体相互作用的确认高中生之间的数据集,叫做 ALONE (青少年在 twittEr 上) ,以及描述性的解释。每个互动实例包括 tweets、图片、表情符号和相关的元数据。我们的观察表明,单独的推文并不能为有毒行为提供足够的证据,而在互动中有意义地使用上下文可以使推文突出显示或免除所谓的毒性。
基于 BERT 模型的
社交媒体仇恨言论检测
与种族偏见缓解
Hate Speech Detection and Racial Bias Mitigation in Social Media based on BERT model
地址:
http://arxiv.org/abs/2008.06460
Marzieh Mozafari,Reza Farahbakhsh,Noel Crespi
摘要:针对仇恨性和滥用性内容识别任务,与数据集和训练分类器相关的不同偏差引起了人们的广泛关注。虽然有关滥用语言检测的偏差数据集问题已经得到了较为频繁的处理,但是训练有素的分类器所产生的偏差还没有引起人们的关注。在这里,我们首先介绍一种基于现有的预先训练的语言模型 BERT 的仇恨言论检测转移学习方法,并在两个公开可用的数据集上评估提议的模型,这两个数据集在推特上被注释为种族主义、性别歧视、仇恨或攻击。接下来,我们介绍了一种偏见缓解机制,以减轻在我们的基于 bert 的仇恨言论检测模型的微调过程中的训练集偏见的影响。为此,我们使用正则化方法对输入样本重新赋权,从而减少了高相关训练集的 n-gram 带有类标签的影响,然后用新的重新赋权样本对我们的基于 bert 的预训练模型进行微调。为了评估我们的偏见缓解机制,我们采用了一种跨域方法,我们使用上述数据集上的训练分类器来预测来自 Twitter 的两个新数据集的标签,AAE 和 White-aligned 组,它们分别表示用非裔美国人英语(AAE)和标准美国人英语(SAE)写的 tweets。结果显示,受过训练的分类器中存在系统的种族偏见,因为他们倾向于将 AAE 结盟的群体用 AAE 写的推文分配到负面的类别,如种族主义、性别歧视、仇恨和冒犯,这比用 SAE 写的白人结盟的推文更常见。然而,在我们的偏误缓解机制中加入种族偏误后,我们的量词中的种族偏误显著减少。这项工作可以为消除仇恨言论和辱骂性语言检测系统迈出第一步。
MILE: A Multi-Level Framework for Scalable Graph Embedding
地址:
https://arxiv.org/abs/1802.09612
Jiongqian Liang,Saket Gurukar,Srinivasan Parthasarathy
摘要:近年来,图嵌入方法的设计引起了人们极大的兴趣。由于计算复杂性和内存需求,很少有人能够扩展到包含数百万个节点的大型图。在本文中,我们通过引入多级嵌入(multi- level Embedding,MILE)框架——一种允许现代图嵌入方法扩展到大型图的通用方法——来放松这种局限性。MILE 使用一种混合匹配技术反复地将图形粗化为更小的图形,以保持图形的主干结构。然后将已有的嵌入方法应用于粗糙图上,通过图的卷积神经网络对原图的嵌入进行改进。该框架与底层图嵌入技术无关,可以应用于许多现有的图嵌入方法而不需要修改。我们在几种常用的图嵌入技术上采用了我们的框架,并对真实世界的图进行了嵌入。在5个大规模数据集上的实验结果表明,对于节点分类任务,在生成高质量嵌入的同时,MILE 显著提高了图形嵌入的速度(数量级)。MILE 可以舒适地扩展到一个包含900万个节点和4000万条边的图,在这个图上,现有的方法要么耗尽内存,要么在现代工作站上计算时间过长。我们的代码和数据都是公开的,并提供了添加新的基嵌入方法的详细说明: URL { this https URL }。
一种尺寸并不适用于所有的情况:
Stack Overflow 中的徽章行为研究
One Size Does Not Fit All: A Study of Badge Behavior in Stack Overflow
地址:
http://arxiv.org/abs/2008.06125
Stav Yanovsky,Nicholas Hoernle,Omer Lev,Kobi Gal
摘要:徽章是在线交互网站的地方特色,从问答网站到共乘系统,都是对参与者贡献的奖励。本文研究徽章设计如何随着时间的推移影响人们的贡献和行为。过去的工作已经表明,徽章会“引导”人们的行为,使他们在获得徽章之前大幅增加贡献金额,之后立即减少他们的贡献,回到他们的基准贡献水平。相比之下,我们发现导向效应取决于用户的类型,正如用户贡献的速度和强度所建模的那样。我们使用这些方法来区分不同的用户活动组,包括那些尽管是站点的重要贡献者但不受徽章系统影响的用户。我们提供了一个预测模型,用户在系统生命周期中如何更改他们的活动组。我们在 Stack Exchange 的三个不同的问答网站上,针对两种类型的活动(编辑和投票) ,用成千上万的用户进行了实证研究。
Exo-SIR:
分析印度新冠肺炎
外源感染影响的流行病学模型
Exo-SIR: An Epidemiological Model to Analyze the Impact of Exogenous Infection of COVID-19 in India
地址:
http://arxiv.org/abs/2008.06335
Nirmal Kumar Sivaraman,Manas Gaur,Shivansh Baijal,Ch V Radha Sai Rupesh,Sakthi Balan Muthiah,Amit Sheth
摘要:流行病学模型是捕捉流行病动态的数学模型。病毒的传播途径有外源性和内源性两种。外源性传播是来自被研究群体之外,内源性传播是来自被研究群体之内。虽然有些模型考虑了传染病的外源性,但它们没有研究外源性和内源性传播之间的相互作用。本文介绍了一种新的模型—— Exo-SIR 模型,该模型同时捕捉病毒的外源和内源传播。通过分析,找出科维迪19大流行期间内源性和外源性感染之间的关系。首先,我们模拟 Exo-SIR 模型,没有假设任何接触网络的人口。其次,通过假设联系网络是一个无标度网络进行模拟。第三,我们在一个真实的 Covid19数据集上实现了 Exo-SIR 模型。我们发现,内源性感染受到影响,即使是最小的外源性感染率。另外,我们发现在外源感染存在的情况下,内源性感染峰值较高,峰值出现的时间较早。这意味着,如果我们考虑我们对 Covid19这样的大流行的反应,我们应该为更早和更高数量的病例做好准备,而不是 SIR 模型所建议的如果存在外源性感染源的话。
Risk mapping for COVID-19 outbreaks using mobility data
地址:
http://arxiv.org/abs/2008.06193
Cameron Zachreson,Lewis Mitchell,Michael Lydeamore,Nicolas Rebuli,Martin Tomko,Nicholas Geard
摘要:新型冠状病毒肺炎是高传染性疾病,控制疾病爆发需要迅速有效的应对措施。由于感染可能由出现症状前或无症状的人传播,因此在诊断临床病例之前很可能发生大量未被发现的传播。因此,在爆发疫情时,需要预测哪些人群和地点有更高的接触风险。在这项工作中,我们评估的效用,聚合人类流动性数据估计传播风险的地理分布。我们提出了一个简单的程序,生成空间传输风险评估从接近实时的人口流动数据。我们根据澳大利亚3个有充分证据的新型冠状病毒肺炎暴发情景验证了我们的估计。其中两个是明确界定的传播集群,一个是社区传播情景。我们的研究结果表明,流动性数据可以很好地预测来自传播中心的接触风险的地理模式,特别是在涉及工作场所或与习惯性旅行模式相关的其他环境的情况下。对于社区传播场景,我们的研究结果表明,当病例计数低且空间集群时,移动数据为风险预测增加了最大的价值。我们的方法可以帮助卫生系统分配检测资源,并可能指导实施针对地理位置的行动和社会互动限制。
An In-Depth Analysis of Ride-Hailing Travel Using a Large-scale Trip-Based Dataset
地址:
http://arxiv.org/abs/2008.06050
Jianhe Du,Hesham A. Rakha,Helena Breuer
摘要:随着快速增长的打车(RH)使用,需要更好地了解和规范行业出现。本文分析了大芝加哥地区一年来相对湿度旅行的数据,以研究相对湿度旅行模式。分析了超过1.04亿人次的旅行。就行程费率而言,结果显示全年的总行程数目保持稳定,合并行程的比率稳步从20% 下降至9% 。相对于工作日,人们倾向于在周末使用相对湿度。具体来说,周末相对湿度出行计数(每天)平均比工作日出行计数高出20% 。这项工作的结果将有助于决策者和运输管理人员更好地了解生殖健康旅行的性质,从而可以为打车行业设计一个更好的规章和指导系统。
传播网络的空间随机 SIR 模型
及其在中国新冠肺炎流行病中的应用
A Spatial Stochastic SIR Model for Transmission Networks with Application to COVID-19 Epidemic in China
地址:
http://arxiv.org/abs/2008.06051
Tatsushi Oka,Wei Wei,Dan Zhu
摘要:世界各地的政府已经实施了预防措施,以防止冠状病毒病的传播。新型冠状病毒肺炎。在这项研究中,我们考虑一个多变量离散时间 Markov 模型来分析新型冠状病毒肺炎在中国33个省区的传播。这种方法使我们能够评估流动性限制政策对疾病传播的影响。我们使用人类每日跨区域流动的数据,并应用贝叶斯框架来估计所提出的模型。结果表明,该病在中国的传播主要是由地区内的社区传播和地方政府采取的封锁政策抑制了该流行病的传播。进一步,我们证明湖北只是早期疫情的中心。2020年1月下旬,北京、广东等次级震中已经建立,疾病蔓延至相关地区。在实行跨区域人员流动限制后,这些震中的传播显著下降。
An empirical model on the dynamics of Covid-19 spread in human population
地址:
http://arxiv.org/abs/2008.06346
Nilmani Mathur,Gargi Shaw
摘要:我们提出了一个数学模型来分析在正在进行的大流行中一个地区感染新型冠状病毒肺炎的总人数的时间演变。利用不同国家新型冠状病毒肺炎感染人群的可用数据,我们建立了一个模型,该模型可以成功地跟踪在给定的一波传染病中从早期到饱和期的时间演变。它涉及一组有效的参数,可以从可用的数据中提取出来。利用这些参数还可以预测未来疾病传播的轨迹。本文还提出了一组微分方程,其解就是这些时间演化轨迹。利用这样的形式主义,我们预测了未来感染扩散的进化轨迹,这些国家的新型冠状病毒肺炎感染仍在迅速上升。
DINE: A Framework for Deep Incomplete Network Embedding
地址:
http://arxiv.org/abs/2008.06311
Ke Hou,Jiaying Liu,Yin Peng,Bo Xu,Ivan Lee,Feng Xia
摘要:网络表示学习(NRL)在节点分类和链路预测等多种任务中发挥着重要作用。它的目的是学习基于网络结构或节点属性的低维向量表示。虽然嵌入技术在完整网络上的应用已经得到了广泛的研究,但是在现实应用中,收集完整网络仍然是一个具有挑战性的任务。为了弥补这一缺陷,本文提出了一种深度不完全网络嵌入方法—— DINE。具体来说,我们首先使用期望最大化框架来完成一个部分可观测网络中的缺失部分,包括节点和边。为了提高嵌入性能,我们考虑了网络结构和节点属性来学习节点表示。在实证研究中,我们对三个网络上的 DINE 进行了多标签分类和链接预测任务的评估。结果表明,我们提出的方法优于国家的最先进的基线。
如果你经常关注复杂系统和跨学科研究进展,是网络论文速递栏目的长期读者,欢迎扫描集智小助手,向我们反馈你的需求。欢迎提出宝贵意见,我们一起来探索追踪前沿进展的更好方式。
参与论文速递用户调研后,我们将邀请你加入集智的科研文献交流群。
对比网络分析的可视化框架 | 网络科学论文速递28篇
从幂律到极值混合分布 | 网络科学论文速递18篇
分析网络的网络 | 网络科学论文速递22篇
新冠疫情期间新浪微博上的注意力动力学 | 网络科学论文速递17篇
基于环境噪声的网络重构 | 网络科学论文速递18篇
集智俱乐部QQ群|877391004
商务合作及投稿转载|swarma@swarma.org
◆ ◆ ◆
搜索公众号:集智俱乐部
加入“没有围墙的研究所”
让苹果砸得更猛烈些吧!
👇点击“阅读原文”,了解更多最新arxiv论文