本文由机器翻译,仅供参考,感兴趣请查阅论文原文

核心速递


  • 估计COVID-19大流行中的感染病例数;
  • 在斯洛文尼亚社会网络上模拟COVID-19大流行:估计预测内生不确定性;
  • 疫情新闻:主流新闻媒体的Facebook专题页面和冠状病毒危机-计算内容分析;
  • 瑞典SARS-CoV-2感染者的比例估计;
  • 大规模去偏候选生成的对比学习;
  • 无缝统一属性和项目:冷启动用户的会话建议;
  • 可解释的高效异构图卷积网络;
  • 人类邻近网络的双曲映射;
  • 不断演化的科学网络的结构动力学;
  • 复杂网络的几何同余和有效贪婪可导航性;
  • 网络分析法检测虚假信息活动;
  • 用于Twitter上的舆论预测的神经时态舆论建模;
  • 含时科学作者网络中的性别和协作模式;
  • NARMADA:灾难和逆境的需求和可用资源管理助理;





估计COVID-19大流行中的感染病例数


原文标题:

Estimating the Number of Infected Cases in COVID-19 Pandemic

地址: 
http://arxiv.org/abs/2005.12993
作者:
Donghui Yan, Ying Xu, Pei Wang

摘要:COVID-19大流行对人类生活造成了重大干扰。广泛的社会焦虑背后的一个重要原因是关于大流行的巨大不确定性。一个主要的不确定因素是感染了多少人或百分比的人?在地方,国家或全球范围内已发布并经常更新有关大流行的各种统计数据。但是,由于种种原因,这些报告的数字中未包括许多案件。我们提出了一种结构化的方法来估计未报告病例的数量,其中我们区分了报告病例中迟到的病例以及症状较轻或没有症状的病例,因此根本没有被任何医疗系统捕获。我们将报告后的数据用于前者的估算以及与后者的人口匹配。我们估计,截至2020年4月20日,应通过乘以220.54%的系数来纠正美国报告的感染病例数。美国人口中的感染率估计为0.53%,这意味着该病的死亡率为2.85%,接近世界卫生组织建议的3.4%。



在斯洛文尼亚社会网络上

模拟COVID-19大流行:

估计预测内生不确定性


原文标题:

Simulation of the COVID-19 pandemic on the social network of Slovenia: estimating the intrinsic forecast uncertainty

地址: 
http://arxiv.org/abs/2005.13282
作者: 
Ziga Zaplotnik, Aleksandar Gavric, Luka Medic

摘要:在本文中,病毒传播模型是在简化的社会网络上构建的。该社会网络由超过200万个节点组成,每个节点代表斯洛文尼亚的居民。这些节点根据实际的家庭和养老中心的分布进行组织和互连,而它们在这些集群外部的连接则是半随机分布和完全链接的。病毒传播模型与疾病进展模型耦合。具有扰动的传播和疾病参数的集成方法用于量化集成传播,这是预测不确定性的主体。将斯洛文尼亚目前对COVID-19流行病的持续预测与所收集的斯洛文尼亚数据进行比较。结果表明,目前在家庭/养老院内部传播的可能性是在家庭之外的两倍。我们使用一组模拟(N = 1000)来反演获得模型参数的后验分布,并估计COVID-19预测的不确定性。我们发现在不受控制的流行中,内在的不确定性主要源于病毒生物学的不确定性,即其繁殖数量。在感染人口比例较低的受控流行病中,社会网络的随机性成为预测不确定性的主要来源,尤其是对于短期预测而言。因此,基于社会网络的模型对于改善流行病预测至关重要。



疫情新闻:

主流新闻媒体的Facebook专题

页面和冠状病毒危机-计算内容分析


原文标题: 

Pandemic News: Facebook Pages of Mainstream News Media and the Coronavirus Crisis — A Computational Content Analysis

地址: 
http://arxiv.org/abs/2005.13290
作者: 
Thorsten Quand, Svenja Boberg, Tim Schatto-Eckrodt, Lena Frischlich

摘要:对于全球新闻媒体而言,COVID-19大流行的蔓延一直是前所未有的挑战。尽管新闻业本来是要通过设计来处理未知事件,但动态发展的形势却以深刻的方式影响着生活的各个方面,甚至危机报告的常规程序似乎也不够用。评论家指出,赛马报道趋向于不加批评,新闻报道过于接近官方声明,对政治决定也持肯定态度。但是,到目前为止,还缺乏有关危机期间新闻媒体表现的经验数据。本研究基于2020年1月至2020年3月的大量德国数据,分析了在冠状病毒危机初期的新闻媒体的Facebook消息。使用计算内容分析方法,覆盖率和交互作用,主题结构,相关角色,消息否定性,以及虚假新闻和阴谋理论的覆盖范围进行了检查。在危机的各个阶段,近期Facebook报道的主题结构发生了变化,只是部分支持了批评家的主张。初始阶段的话题广度有所欠缺,但后期阶段则涵盖了有关电晕相关问题和社会关注的广泛话题。此外,新闻媒体在危机期间报道了虚假新闻和阴谋论,但他们始终将它们视为真实情况,并揭穿了在公众中流传的虚假说法。尽管对危机期间新闻业表现的一些批评得到了温和的经验支持,但该分析并未发现系统功能失调的压倒性迹象。总体而言,新闻媒体既没有做出统一的反应,也没有出现蔓延的、信息匮乏的大流行新闻,但是他们以多角度报道了危机。



瑞典SARS-CoV-2感染者的比例估计


原文标题: 

Estimates of the proportion of SARS-CoV-2 infected individuals in Sweden

地址:
http://arxiv.org/abs/2005.13519
作者:
Henrik Hult, Martina Favero

摘要:本文研究了贝叶斯SEIR模型,以估计感染SARS-CoV-2(负责COVID-19的病毒)的人口比例。为了捕获人口中的异质性以及采取干预措施以减少流行病扩散的速度,该模型使用了随时间变化的接触率,其对数先于高斯过程。使用Poisson点过程对因COVID-19造成的死亡的发生进行建模,并使用每日死亡计数数据和3月下旬在斯德哥尔摩进行的感染活跃个体的比例快照进行校准。该方法适用于瑞典地区。结果表明,到2020年5月15日,斯德哥尔摩受感染人口的估计比例约为13.5%,在其他调查区域中,这一比例在2.5%至15.6%之间。在斯德哥尔摩,每日死亡人数的高峰可能已经过去,参数不确定性不会严重影响预期的每日死亡人数或预期的累计死亡人数。但是,它确实会影响受感染个体的估计累积数量。在其他地区,无法获得活动感染数量的随机样本,可以使用参数共享来改善估计值,但是参数不确定性仍然很大。



大规模去偏候选生成的对比学习


原文标题:

Contrastive Learning for Debiased Candidate Generation at Scale

地址:
http://arxiv.org/abs/2005.12964
作者:
Chang Zhou, Jianxin Ma, Jianwei Zhang, Jingren Zhou, Hongxia Yang

摘要:深度候选生成已经成为许多工业搜索,推荐和广告系统中越来越受欢迎的选择。随着语言建模社区的发展,标准的深层候选生成模型依赖于复杂的采样技术来近似进行用户与项目交互的最大似然估计。然而,尚不清楚这些采样策略是否是推荐系统中候选生成的最佳选择,因为我们在训练数据中面临着巨大的候选集和各种类型的丰富特征的严重选择偏见。在本文中,我们提出了CLRec,一种用于推荐系统中大规模候选人生成的对比学习范例。CLRec使用基于队列的缓冲区将以前的示例或表示形式保存为否定标签,在其中优化了对比损失。该框架可实现更好的性能,而无需显式采样,从而在标签侧对丰富类型的特征进行编码时提供了极大的效率。我们在理论和经验上都分析了CLRec实际上可以减轻选择偏见,从而导致更多样化和更公平的建议。我们在淘宝上部署了CLRec,并在交通繁忙的情况下进行了在线A / B测试,显示出在性能和效率上都有较大幅度的提高,并且显著减少了“致富”现象。



无缝统一属性和项目:

冷启动用户的会话建议


原文标题:

Seamlessly Unifying Attributes and Items: Conversational Recommendation for Cold-Start Users

地址:
http://arxiv.org/abs/2005.12979
作者:
Shijun Li, Wenqiang Lei, Qingyun Wu, Xiangnan He, Peng Jiang, Tat-Seng Chua

摘要:诸如协作过滤之类的静态推荐方法受制于为冷启动用户执行实时个性化设置的固有局限性。在线推荐(例如,多臂bandit方法)通过在线互动地探索用户偏好并进行探索-开发(EE)权衡来解决这一限制。但是,现有的基于bandit的方法对推荐动作进行了均匀建模。具体地,他们仅将物品视为武器,不能处理物品属性,自然可以提供用户当前需求的可解释信息,并可以有效地过滤掉不需要的物品。在这项工作中,我们考虑了对冷启动用户的对话推荐,系统可以同时向用户询问属性和向用户推荐项目。在最近的工作中研究了这一重要场景。但是,它采用手工制作的功能来决定何时询问属性或提出建议。属性和项目的这种单独建模使系统的有效性高度依赖于手工功能的选择,从而给系统带来了脆弱性。为了解决此限制,我们无缝地统一了同一手臂空间中的属性和项,并使用Thompson Sampling框架自动实现了它们的EE折衷。我们的会话汤普森抽样(ConTS)模型通过选择具有最大奖励的手臂来全面解决会话推荐中的所有问题。在三个基准数据集上进行的大量实验表明,在成功率和平均会话转数方面,ConTS优于最新的会话UCB(ConUCB)和Estimation-Action-Reflection模型。



可解释的高效异构图卷积网络


原文标题:

Interpretable and Efficient Heterogeneous Graph Convolutional Network

地址: 
http://arxiv.org/abs/2005.13183
作者: 
Yaming Yang, Ziyu Guan, Jianxin Li, Jianbin Huang, Wei Zhao

摘要:图卷积网络(GCN)在学习图中节点的有效高级表示形式方面取得了非凡的成功。但是,关于异构信息网络(HIN)的研究仍然很有限,因为现有的面向HIN的GCN方法存在两个缺陷:(1)它们无法灵活地利用所有可能的元路径,有些甚至要求用户指定有用的元路径。那些; (2)他们通常需要首先通过计算通勤矩阵将HIN转换为基于元路径的图,这具有较高的时间复杂度,导致可伸缩性较差。为了解决上述问题,我们提出了可解释且有效的异构图卷积网络(即HGCN),以学习HIN中节点的表示形式。它会自动从所有可能的元路径(在由模型深度确定的长度限制内)中为每个节点提取有用的元路径,从而带来良好的模型可解释性。它直接将整个HIN作为输入,并避免了中间HIN转换。精心设计的分层聚合体系结构避免了计算效率低下的邻域关注。因此,它比以前的方法有效得多。我们正式证明ie-HGCN在长度限制(模型深度)内评估所有可能的元路径的有用性,表明它本质上对HIN执行谱图卷积,并分析时间复杂度以验证其准线性可扩展性。在三个真实世界网络上的大量实验结果表明,ie-HGCN优于最先进的方法。



人类邻近网络的双曲映射


原文标题:

Hyperbolic Mapping of Human Proximity Networks

地址:
http://arxiv.org/abs/2005.13216
作者:
Marco A. Rodríguez-Flores, Fragkiskos Papadopoulos

摘要:人类邻近网络是代表物理空间中人类之间近距离邻近的时间网络。在过去的15年中,对它们进行了广泛的研究,因为它们对于了解人类中疾病和信息的传播至关重要。在这里,我们解决了将人类邻近网络映射到双曲空间的问题。这些网络的每个快照通常非常稀疏,由少量的交互(即非零度)节点组成。然而,我们表明,使用传统复杂网络开发的现有方法,可以将此类系统在足够大的时间范围内的时间汇总表示形式有意义地嵌入到双曲空间中。我们从理论上证明这种兼容性,并通过实验进行验证。我们生成了六个不同的实际系统的双曲图,并表明该图可用于识别社区,促进时态网络上的高效贪婪路由以及以显著的精度预测未来的链接。



不断演化的科学网络的结构动力学


原文标题: 

Structure dynamics of evolving scientific networks

地址:
http://arxiv.org/abs/2005.13251
作者:
Demival Vasques Filho, Dion R. J. O’Neale

摘要:在网络科学中,共同作者网络被广泛研究,因为它们构成了系统的单个元素如何在复杂的,非平凡的交互结构上产生集体现象的完美示例。但是,共同作者网络实际上是原始两方网络的单模投影,我们在这里将其称为科学网络,其中作者是与人工制品相关的主体-他们已发表的论文。但是,很少有研究考虑原始的二分网络的结构来理解和解释投影网络的拓扑特性。在这里,我们使用来自美国物理学会(APS)的广泛数据集(可追溯到1893年至2015年,包括2015年)和arXiv(1986-2015年)创建双向网络。我们考虑了两方网络的四个主要特征,即程度分布,密度,冗余度和周期,研究了出版物的时间演变和科学网络的动态结构。我们展示了这些特征如何塑造共同作者网络的形成及其观察到的结构特性。尽管大多数学科的网络结构并未显示出随时间变化的显著变化,但在物理学中,大型协作的出现在很大程度上导致了顶级节点的倾斜度分布。后者反过来在投影中引起大量派别,引发了共同作者网络的相当大的致密化,而原始两方网络的密度保持在同一水平。



复杂网络的几何同余

和有效贪婪可导航性


原文标题:

Geometrical congruence and efficient greedy navigability of complex networks

地址:
http://arxiv.org/abs/2005.13255
作者: 
Carlo Vittorio Cannistraci, Alessandro Muscoloni

摘要:双曲网络被认为与其潜在的几何形状是一致的,双曲空间中的测地线被认为等效于通过拓扑最短路径(TSP)导航。这种几何上一致的假设被认为是双曲网络几乎最大有效贪婪导航的原因。在这里,我们提出了一种称为几何一致性(GC)的复杂网络度量,并且我们表明可能存在不同的TSP,其双曲空间中的投影(pTSP)差异很大,并且与各自的测地线显著不同。我们发现,与当前的看法相反,双曲网络没有表现出一般的几何一致性和有效的可导航性,在使用nPSO模型生成的网络中,双曲网络似乎仅在幂律指数接近2时才出现。也会影响真实的网络分析,实际上,它会按性别或年龄分组显著改变结构性大脑连接组。



网络分析法检测虚假信息活动


原文标题:

On the Detection of Disinformation Campaign Activity with Network Analysis

地址: 
http://arxiv.org/abs/2005.13466
作者:
Luis Vargas, Patrick Emami, Patrick Traynor

摘要:近年来,随着虚假信息运动试图分化政治话题,在线操纵信息已变得普遍。尽管我们知道存在虚假宣传活动,但要检测其在线存在仍然很困难。研究人员建议通过寻找特定的协调模式来检测Twitter上的虚假信息活动(例如,在短时间内共享相同的主题标签)。然而,这种方法的问题在于,尽管所提议的协调模式可能是所研究的虚假信息运动所独有的,但这种模式尚未针对非随机样本或在各种运动中得到充分验证。我们研究了这些协调模式对从其他Twitter活动中识别虚假宣传活动的有效性。为此,我们通过在由十个州政府发起的竞选活动和各种良性Twitter社区组成的大规模数据集上测试建议的协调模式,以在彼此之间协调和共享信息。我们表明,这种模式有很大的局限性。首先,Twitter社区中的协调并不少见,特别是当在线世界对真实世界的新闻做出反应时(例如,美国弹each审判)。其次,由于COVID-19大流行,我们发现政治机构增加了其协调活动。这种协调性激增恶化了可用性和检测率之间的权衡。为了识别大流行期间的大多数良性活动,分类器会忽略近25%的虚假信息活动。相反,如果分类器检测到恶意协调的比率很高,则会对46%的合法协调活动进行错误分类。在进行这项荟萃分析时,我们表明,尽管协调模式对于检测虚假信息活动可能有用,但仍需要进一步分析以确定社区的意图。



用于Twitter上的舆论

预测的神经时态舆论建模


原文标题:

Neural Temporal Opinion Modelling for Opinion Prediction on Twitter

地址:
http://arxiv.org/abs/2005.13486
作者: 
Lixing Zhu, Yulan He, Deyu Zhou

摘要:由于推文内容和社区环境的短暂性,Twitter上的观点预测具有挑战性。在本文中,我们将用户的tweet发布行为建模为一个时间点过程,以在给定用户的历史tweet序列和邻居发布的tweet的情况下,共同预测发布时间和下一条tweet的立场标签。我们设计了一个主题驱动的注意力机制,以捕获邻居上下文中的动态主题转移。实验结果表明,与许多竞争基准相比,该模型可以更准确地预测发布时间和未来推文的立场标签。



含时科学作者网络中的性别和协作模式


原文标题: 

Gender and collaboration patterns in a temporal scientific authorship network

地址: 
http://arxiv.org/abs/2005.13512
作者:
Gecia Bravo-Hermsdorff, Valkyrie Felso, Emily Ray, Lee M. Gunderson, Mary E. Helander, Joana Maria, Yael Niv

摘要:可以指出STEM中性别平等的各种历史性里程碑(科学,技术,工程和数学),但是,实际效果是渐进的且持续不断的。重要的是,量化科学工作子域中的性别差异,以发现潜在的偏见并监控进度。在这项工作中,我们在运营研究与管理科学学院(INFORMS)中研究了性别在科学合作模式中的相关性,该研究所是一个拥有十六种同行评审期刊的专业协会。利用他们从1952年到2016年的出版数据,我们在作者和出版物之间建立了一个大型的时间双向网络,并使用性别标签扩展了作者节点。我们随着时间的推移,对该网络的几个基本统计数据中的差异进行了特征描述,强调了它们在相关历史事件方面的变化。我们发现,从1980年左右开始,妇女的参与率稳步上升(例如,妇女和新女性作者的著作权份额有所下降)。但是,在INFORMS社会中,妇女所占比例仍不到25%,在许多出版物中,妇女所占比例甚至更低。此外,我们描述了一种方法,用于量化作者身份相对于网络的整体连通性的结构性作用,用它来衡量女性和男性之间的作者身份之间的细微差异。具体来说,作为作者结构重要性的衡量指标,我们使用有效的抗拒性和收缩重要性,这是与整个网络中的传播有关的两项衡量指标。作为零模型,我提出了带有紧急社区的保度时态和几何网络模型。们的研究结果表明,男女合作模式之间存在系统性差异,而这只能由当地统计数据来解释。



NARMADA:灾难和逆境的

需求和可用资源管理助理


原文标题:

NARMADA: Need and Available Resource Managing Assistant for Disasters and Adversities

地址: 
http://arxiv.org/abs/2005.13524
作者: 
Kaustubh Hiware, Ritam Dutt, Sayan Sinha, Sohan Patro, Kripabandhu Ghosh, Saptarshi Ghosh

摘要:尽管在灾难期间利用在线社交媒体进行了大量研究,但还没有针对灾难后场景至关重要的特定任务的系统-确定受灾地区的资源需求和资源可用性,加上他们随后的匹配。为此,我们介绍了NARMADA,这是一个半自动化的平台,该平台利用了来自社交媒体帖子的众包信息来协助灾后救灾协调工作。该系统采用自然语言处理和信息检索技术来从微博中识别资源需求和资源可用性,从帖子中提取资源,并将需求与合适的可用性进行匹配。因此,该系统能够在灾难后的救援行动中促进对资源的明智管理。

来源:网络科学研究速递
编辑:王建萍

声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。



近期网络科学论文速递


鲁棒图神经网络的图结构学习 | 网络科学论文速递40篇

居家令对SARS-CoV-2传播影响的因果估计 | 网络科学论文速递24篇

为什么大多数COVID-19感染曲线呈线性?| 网络科学论文速递37篇

COVID-19流行病的城市标度律 | 网络科学论文速递28篇

COVID-19与社会隔离悖论:危险与解决方案 |  网络科学论文速递21篇

加入集智,一起复杂!






集智俱乐部QQ群|877391004

商务合作及投稿转载|swarma@swarma.org

◆ ◆ 

搜索公众号:集智俱乐部


加入“没有围墙的研究所”

让苹果砸得更猛烈些吧!