本文由机器翻译,仅供参考,感兴趣请查阅论文原文

核心速递



  • COVID-19大流行:增长模式、幂律尺度和饱和;

  • 通过图卷积网络增强;

  • 城市间移动网络的健壮性分析:将市、州和联邦行动建模为失效和攻击;
  • 神经网络辅助全球Covid-19传播的隔离控制模型估计;
  • 基于iSEIR模型的中国COVID-19传播暴发关键转折期的预测框架;
  • 纽约州各县COVID 19爆发时间表的分析;
  • Twitter社会移动指数:根据带地理位置推文衡量社会隔离实践;
  • 疾病大流行的民粹主义:替代新闻媒体的Facebook页面和冠状病毒危机——计算内容分析;
  • 路易斯安那州COVID-19的发展预测;
  • 流行病风险评估的新方法:意大利COVID-19疫情爆发案例;
  • COVID-19:非均匀随机社会网络上的传染分析;
  • 用于COVID-19社会科学研究的开放获取机构和新闻媒体推特数据集;
  • 量化社交媒体上的谣言传播;
  • 利用多源弱社会监督及早发现虚假新闻;
  • 侵略性、重复性、故意性、可见性和不平衡性:完善网络欺凌分类的表示形式;
  • 关于人群拥挤程度的一些考虑;
  • 中国股市崩盘的流动性不足网络;
  • 命名博弈动力学全景:从特质竞争到贝叶斯推理;
  • 从数据推断网络结构;
  • 隐私阴影:随着时间的推移测量节点的可预测性和隐私;
  • 设计和连接检查来自用户-项目评分数据的隐式社会网络;
  • 网页爬取中的变化率估计和最佳新鲜度;
  • eBay的移动指标检测和预警系统;
  • 复杂网络上的二元动力学:随机成对逼近和超越;
  • 群体智慧预测COVID-19传播的严重性;
  • 危机关键型知识产权:COVID-19大流行的发现;
  • 冠状病毒大流行期间Twitter消息的词频和情绪分析;
  • 流行病与遏制措施;
  • 如何最好地预测Covid-19的每日新感染数;
  • 评估针对COVID-19流行病的“信息传播”风险;
  • 用于开放科学研究的大规模COVID-19 Twitter聊天数据集——国际合作;
  • 科学专家发现的新数据集和文档网络嵌入方法的基准;
  • 意见网络建模与实验;
  • 预算约束下的社会网络中的收益最大化;
  • 印度铁路区的复杂网络分析;
 


COVID-19大流行:

增长模式、幂律尺度和饱和


原文标题:
The COVID-19 pandemic: growth patterns, power law scaling, and saturation
地址:
http://arxiv.org/abs/2004.03859
作者:
H. M. Singer

摘要:由于有效的政府制定的封锁措施和社会隔离措施,越来越多的国家显示出新的COVID-19感染数量显著下降。我们通过局部斜率分析对影响最大的25个国家的增长行为进行了分析,发现各国根据锁定协议的严格程度遵循三种不同的模式:指数上升和下降,幂律,或逻辑斯蒂。对于显示幂律增长的国家,我们已经确定了比例指数。对于感染率大幅下降的国家,我们推断出感染数量的预期饱和度和预计的最终日期。使用了两种不同的外推方法(逻辑和抛物线)。两种方法在饱和度和结束日期的数量级上都一致。使用相同的方法分析全球感染率。讨论了这些推断的相关性和准确性。



通过对抗图卷积网络增强社会推荐


原文标题:
Enhance Social Recommendation with Adversarial Graph Convolutional Networks
地址:
http://arxiv.org/abs/2004.02340
作者:
Junliang Yu, Hongzhi Yin, Jundong Li, Min Gao, Zi Huang, Lizhen Cui

摘要:行业的最新报告显示,社交推荐系统在实践中始终失败。根据负面结果,失败的原因是:(1)大多数用户在社会网络中只有很少数量的邻居,几乎无法从关系中受益;(2)社会关系嘈杂,但经常被不加区别地使用;(3)假定社会关系实际上是多面的,并且在不同情况下显示出不同的优势,但它们普遍适用于多种情况。现有的大多数社交推荐模型仅考虑社会网络中的同质性,而忽略了这些缺点。在本文中,我们提出了一个基于图卷积网络(GCN)的深度对抗框架来解决这些问题。具体而言,针对关系稀疏性和噪声问题,开发了一种基于GCN的自动编码器,通过对高阶和复杂连接模式进行编码来增强关系数据,同时在重构原始社会档案的约束下对其进行优化以保证有效性确定的新邻居。在为每个用户获得足够的纯净社交关系后,将设计一个基于GCN的关注社交推荐模块,以捕获社交关系的异类优势。这些设计分别处理了社交推荐系统所面临的三个问题。最后,我们通过对抗性训练来玩Minimax博弈来统一和强化所有组成部分,并确保协调一致地努力以增强社交推荐。在多个开放数据集上的实验结果证明了我们框架的优越性,而消融研究证实了每个组件的重要性和有效性。


城市间移动网络的

健壮性分析:将市、州和

联邦行动建模为失效和攻击


原文标题:
Robustness analysis in an inter-cities mobility network: modeling municipal, state and federal initiatives as failures and attacks
地址:
http://arxiv.org/abs/2004.02648
作者:
Vander L. S. Freitas, Jeferson Feitosa, Catia S. N. Sepetauskas, Leonardo B. L. Santos

摘要:受与COVID-19流行病相关的挑战和寻求最佳遏制策略的推动,我们提出了对城市间移动性复杂网络的鲁棒性分析。我们将市政措施抽象为节点的故障,将联邦行动抽象为有针对性的攻击。地理(图)方法用于可视化地理图并生成拓扑索引(例如程度和脆弱性)的图。巴西2016年的数据被认为是一个案例研究,涉及超过5000个城市和27个州。基于网络健壮性指数,我们显示出最有效的攻击策略已从针对所有城市网络的拓扑度转变为基于巴西国家作为节点的网络的拓扑脆弱性。此外,我们的研究结果表明,各个市政当局的行为不会对行动不便造成严重影响,因为它们往往是准时的,并且与整个国家/地区无关。相反,特定城市的协调隔离是分离整个网络区域并因此阻止传播过程占上风的关键。




神经网络辅助全球Covid-19

传播的隔离控制模型估计


原文标题:
Neural Network aided quarantine control model estimation of global Covid-19 spread
地址:
http://arxiv.org/abs/2004.02752
作者:
Raj Dandekar, George Barbastathis

摘要:自2019年12月31日在中国湖北省武汉市首次记录现在称为Covid-19的感染以来,该疾病已在全球蔓延,并遇到了各种各样的社会隔离和检疫政策。众所周知,随着个人出行,故意或无意违反政策以及感染他人而不被发现,这些反应的有效性很难量化。在本文中,我们尝试使用混合的第一性原理流行病学方程和数据驱动的神经网络模型来解释和推断可公开获得的数据。利用我们的神经网络增强模型,我们将分析重点放在四个地区:武汉,意大利,韩国和美国,并比较隔离和隔离措施在这些国家/地区中对控制有效繁殖数量的作用 R_ t 的病毒。我们的研究结果明确表明,实施了政府的快速干预和严格的检疫和隔离公共卫生措施的国家,成功地制止了感染的蔓延并防止其呈指数级增长。我们通过匹配武汉2020年3月3日至4月1日以及意大利和韩国2020年3月25日至4月1日期间的预测来检验模型的预测能力。以美国为例,我们的模型可以很好地捕捉当前感染曲线的增长,并预测到2020年4月20日传播将停止。我们进一步证明,现在放宽或逆转隔离措施将导致感染病例数呈指数爆炸式增长,使自2020年3月中旬以来美国实施的所有措施所扮演的角色无效。




基于iSEIR模型的中国COVID-19

传播暴发关键转折期的预测框架


原文标题:
The Framework for the Prediction of the Critical Turning Period for Outbreak of COVID-19 Spread in China based on the iSEIR Model
地址:
http://arxiv.org/abs/2004.02278
作者:
George Xianzhi Yuan, Lan Di, Yudi Gu, Guoqi Qian, Xiaosong Qian

摘要:这项研究的目的是建立一个总体框架,以预测今年年初中国发生的COVID-19传染病等传染病流行的关键转折期。该框架能够及时预测应用于COVID-19流行病的转折期,并告知有关当局采取适当及时的措施来控制该流行病。预计它将提供有关当前与COVID-19大流行进行战斗的转折期的有见地的信息。我们框架中的基础数学模型是个体易感暴露-传染性去除(iSEIR)模型,它是扩展经典SEIR模型的一组微分方程。我们使用2020年2月6日至10日在武汉观察到的每日COVID-19病例作为iSEIR模型的输入,并能够基于以下数据生成2月10日午夜第二天COVID-19病例动态的轨迹:根据更新后的模型,我们预测武汉的COVID-19暴发的转折期将在2月14日之后的一周内到来。这种预测变得及时而准确,为政府,医院,重要行业和企业提供了充足的时间。服务以满足高峰需求并准备善后计划。我们的研究还通过果断实施自2020年1月23日起在武汉实施的“锁定与隔离控制计划”,支持观察到的对平展流行曲线的有效性。武汉的经验为全世界在对抗COVID-19方面的学习提供了一个示范课程。




纽约州各县COVID-19

爆发时间表的分析


原文标题:
Analysis of the COVID 19 outbreak timeline in New York State counties
地址:
http://arxiv.org/abs/2004.02366
作者:
Anca Radulescu

摘要我们说明并研究了整个纽约州以及每个县在3月1日至4月1日期间报告的感染情况的演变。我们搜索指数趋势,并尝试了解这些趋势的时间和动态与国家规定的有关社会疏离和测试的措施是否相关。我们的结论是,4月1日的报告可能无法充分说明全州范围内的实际感染情况,因此我们建议在未来几周内重新评估数据,以监测PAUSE指令的效果以及不断增加的感染率。人员伤亡作为一种验证措施。




Twitter社会移动指数:根据

带地理位置推文衡量社会隔离实践


原文标题:
The Twitter Social Mobility Index: Measuring Social Distancing Practices from Geolocated Tweets
地址:
http://arxiv.org/abs/2004.02397
作者:
Paiheng Xu, Mark Dredze, David A. Broniatowski

摘要:远离社会是应对新型冠状病毒(COVID-19)大流行的重要组成部分。尽量减少社交互动和旅行,会降低感染传播的速度,并“拉平曲线”,以便医疗系统可以更好地治疗感染者。但是,尚不清楚公众将如何应对这些政策。本文介绍了Twitter社会流动性指数,这是一种根据Twitter数据得出的社交距离和出行情况的量度。我们使用公共地理位置的Twitter数据来衡量用户在一周内的旅行量。我们发现,在实施社会隔离政策后,美国的出行人数大幅度减少,早期采用者的州减少幅度更大,而没有政策的州变化幅度较小。我们的发现显示在此http URL上,我们将在大流行期间继续更新我们的分析。




疾病大流行的民粹主义:

替代新闻媒体的Facebook页面

和冠状病毒危机——计算内容分析


原文标题:
Pandemic Populism: Facebook Pages of Alternative News Media and the Corona Crisis — A Computational Content Analysis
地址:
http://arxiv.org/abs/2004.02566
作者:
Svenja Boberg, Thorsten Quandt, Tim Schatto-Eckrodt, Lena Frischlich

摘要:COVID-19大流行不仅造成了严重的政治,经济和社会影响,还以前所未有的方式影响了媒体和通讯系统。尽管传统的新闻媒体试图适应迅速发展的局面,但互联网上的其他新闻媒体却使事件发生了自己的意识旋转。这些声音因加剧社会混乱并通过社交媒体和其他在线渠道传播潜在危险的“假新闻”或阴谋论而受到批评。本研究基于2020年1月至2020年3月下半年的大量德国数据,在对冠状病毒危机初期的替代新闻媒体在Facebook上的输出进行的初始计算内容分析中,分析了此类恐惧的事实基础。使用计算内容分析,信息的方法,范围,互动,参与者和主题,以及捏造的新闻和阴谋论的使用。分析表明,替代新闻媒体忠于先前研究中确定的消息模式和意识形态基础。尽管它们没有散布明显的谎言,但它们主要是分享过于挑剔,甚至是反系统的信息,这与主流新闻媒体和政治体制的观点背道而驰。正如这种分析所详细描述的那样,由于这种大流行的民粹主义,它们促成了矛盾,险恶和不信任的世界观。




路易斯安那州

COVID-19的发展预测


原文标题:
Projected Development of COVID-19 in Louisiana
地址:
http://arxiv.org/abs/2004.02859
作者:
Ka-Ming Tam, Nicholas Walker, Juana Moreno

摘要:在撰写本文时,路易斯安那州的人均COVID-19感染率在美国排名第三。州政府于3月23日发布了“不在家”命令。我们分析了路易斯安那州COVID-19的预计传播量,其中不包括居家定单的影响。我们预测,如果不采取缓解措施,很大一部分州人口将被感染,并且肯定会淹没路易斯安那州医疗体系的能力。我们进一步预测了感染率降低程度不同的结果。为了将感染人数限制在100万以下,需要减少70%以上。




流行病风险评估的新方法:

意大利COVID-19疫情爆发案例


原文标题
A Novel Methodology for Epidemic Risk Assessment: the case of COVID-19 outbreak in Italy
地址:
http://arxiv.org/abs/2004.02739
作者:
A. Pluchino, G. Inturri, A. Rapisarda, A. E. Biondo, R. Le Moli, C. Zappala’, N. Giuffrida, G. Russo, V. Latora

摘要:我们提出了一种新颖的方法,以便根据不同因素进行流行病风险评估,这有助于理解流行病在一个国家不同地区的不同影响。我们特别讨论了意大利发生COVID-19的案例。我们通过考虑有关空气污染,流动性,冬季温度,住房集中度,医疗保健密度,总人口和老年人口的可用数据来表征意大利的每个地区。我们发现,相对于中部和南部,意大利北部一些地区的流行风险更高。我们的流行病风险指数与意大利发生的COVID-19疫情的官方数据密切相关,并特别解释了为什么伦巴第大区,艾米利亚-罗马涅,皮埃蒙特和威尼托等地区在感染方面比该国其他地区遭受的危害要大得多病例,重症监护病房和死者。尽管COVID-19疫情几乎是在同一时期开始的,但在2020年初,在北部(伦巴第大区和威尼托)和意大利中部(拉齐奥)都得到了正式的认证,这一次疫情已经更广泛地传播了仅在那些具有较高流行病风险的地区具有致命性。由于大部分感染者并未显示出明显的疾病症状,因此我们认为,在流行风险较低的地区,即意大利中部和南部,尽管很可能已经很广泛地传播了该流行病,由于先验风险的暴露程度不同,因此不应像意大利北部那样致命。我们还将讨论与我们的方法直接相关的一些政策含义,其结果是非常灵活并且可以适应不同的流行病历史数据集和不同的国家。




COVID-19:非均匀

随机社会网络上的传染分析


原文标题:
COVID-19: Analytics Of Contagion On Inhomogeneous Random Social Networks
地址:
http://arxiv.org/abs/2004.02779
作者:
T. R. Hurd

摘要:由于需要新颖可靠的方法来模拟Covid-19流行病,因此本文将 N 个人视为不均匀的随机社会网络(IRSN)。网络的节点代表不同类型的个人,边代表重要的社会关系。流行病被描述为传染过程,该过程每天变化,在一天中,由于引入种群的种子感染而触发 0 。假定个人的社会行为和健康状况是随机的,其概率分布随其类型而变化。首先,给出了基本的SI(“易感染性”)网络传染模型的表述和分析,该模型着重于已被感染的人数的累积。主要结果是一个解析公式,该公式在 n 的较大 N 限制下对于第t天的系统状态而言符合初始条件。该公式仅涉及一维积分。接下来,制定了更实际的SIR和SEIR网络模型,包括“已删除”(R)和“已暴露”(E)类。这些模型还得出分析公式,这些公式可以概括SI网络模型的结果。该框架可以轻松地用于分析各种公共卫生干预措施,包括疫苗接种,社会隔离和检疫。公式可以通过有效合并快速傅立叶变换的算法在数值上实现。最后,提出了许多悬而未决的问题和研究途径,例如框架与普通微分方程SIR模型的关系以及基于主体的传染模型,这些模型在现实世界的流行病建模中更常用。




用于COVID-19社会科学研究的

开放获取机构和新闻媒体推特数据集


原文标题:
Open access institutional and news media tweet dataset for COVID-19 social science research
地址:
http://arxiv.org/abs/2004.01791
作者:
Jingyuan Yu

摘要:随着COVID-19迅速成为最受关注的全球危机之一,学术研究中对数据的需求也在增加。目前,有几个开放访问的Twitter数据集,但是它们都没有专门用于机构和新闻媒体Twitter数据收集,为了填补这一空白,我们从69个机构/新闻媒体Twitter帐户中检索了数据,其中17个与政府相关和国际组织,其中52个是北美,欧洲和亚洲的新闻媒体。我们相信我们的开放访问数据可以为研究人员提供更多的资源来开展社会科学研究。




量化社交媒体上的谣言传播


原文标题:
Quantification of the propagation of rumors on social media
地址:
http://arxiv.org/abs/2004.01705
作者:
Chahinez Ounoughi

摘要:谣言(未经验证的信息)在社会网络上的传播受到几个因素的影响,这些因素主要与该信息的内容有关,尤其是与该网络上重新传播的参与者的行为(档案)有关。这种情况可能会根据情况改变这种传播方式,这就是我们所说的谣言之深。这个项目正在解决这个问题。从一个在Twitter上传播谣言的真实案例来看,此文稿提出了一种学术方法来量化社会网络上的谣言深度,并由关注此信息及其审核人员的专家进行使用和解释。




利用多源弱社会监督

及早发现虚假新闻


原文标题:
Leveraging Multi-Source Weak Social Supervision for Early Detection of Fake News
地址:
http://arxiv.org/abs/2004.01732
作者:
Kai Shu, Guoqing Zheng, Yichuan Li, Subhabrata Mukherjee, Ahmed Hassan Awadallah, Scott Ruston, Huan Liu

摘要:社交媒体极大地提高了人们以前所未有的速度参加在线活动。但是,这种不受限制的访问方式也加剧了错误信息和虚假新闻的在线传播,这可能会引起混乱和混乱,除非能早日发现它的缓解措施。鉴于新闻事件的快速发展的性质和带注释的数据数量有限,由于缺乏大量的带注释的训练实例,很难进行早期检测,因此用于假新闻检测的最新系统面临挑战。。在这项工作中,我们利用用户和内容参与提供的来自不同来源的多个微弱信号(称为弱社会监督)及其互补工具来检测假新闻。我们共同利用有限数量的干净数据以及社交活动的微弱信号,在元学习框架中训练深层神经网络,以估计不同弱实例的质量。对现实世界数据集的实验表明,对于在不使用任何用户参与的情况下进行预测的早期检测中,假冒新闻的早期发现,该框架的性能优于最新基准。




侵略性、重复性、故意性、

可见性和不平衡性:

完善网络欺凌分类的表示形式


原文标题
Aggressive, Repetitive, Intentional, Visible, and Imbalanced: Refining Representations for Cyberbullying Classification
地址:
http://arxiv.org/abs/2004.01820
作者:
Caleb Ziems, Ymir Vigfusson, Fred Morstatter

摘要:网络欺凌是在线社区中普遍存在的问题。为了识别大规模社会网络中的网络欺凌案例,内容主持人依靠机器学习分类器进行自动网络欺凌检测。但是,现有模型仍然不适合实际应用,这主要是由于缺乏公开可用的训练数据以及缺乏分配地面真相标签的标准条件。在这项研究中,我们使用原始注释框架解决了对可靠数据的需求。受社会科学研究对欺凌行为的启发,我们使用五个显式因素来表征网络欺凌的细微问题,以代表其社会和语言方面。我们使用社会网络和基于语言的功能对此行为进行建模,从而提高了分类器的性能。这些结果证明了将网络欺凌作为一种社会现象进行表示和建模的重要性。




关于人群拥挤程度的一些考虑


原文标题:
Some considerations on crowd Congestion Level
地址:
http://arxiv.org/abs/2004.01883
作者:
Francesco Zanlungo, Claudio Feliciani, Zeynep Yucel, Katsuhiro Nishinari, Takayuki Kanda

摘要:Feliciani等人(交通研究,2018年)引入了(人群)拥塞级别( CL )的概念,并由C.Feliciani在PED 2018会议上提出。在PED演示之后,除了对新颖的贡献表示赞赏外,还提出了一些有趣的问题,涉及 CL 定义的积分/微分性质以及定义相关纯数字的可能性。在这些简短的注释中,尽管没有严格或正式的尝试,我们仍将提出一些考虑,表明这两个问题是相关的,并提供可能的解决方案。此外,我们将在复杂情况下使用理论论证和对模拟数据的分析,来尝试进一步阐明该概念的含义和应用。最后,我们分析了在“交叉流’’情况下与人类参与者进行的实验的一些结果。




中国股市崩盘的流动性不足网络


原文标题:
The illiquidity network of stocks in China’s market crash
地址:
http://arxiv.org/abs/2004.01917
作者:
Xiaoling Tan, Jichang Zhao

摘要:中国股市在2015年突然暴跌,蒸发了超过三分之一的市值。由于股票的缺乏与恐惧和频率的精细关联,股票的流动性可能为理解甚至暗示市场崩盘提供了一个有希望的观点。在这项研究中,通过连接相互解释流动性波动的股票,建立了流动性网络以对市场进行建模。发现与非崩溃日相比,市场在崩溃日之间的联系更加紧密,这是由于更重但更均匀的非流动性依赖性导致了突然崩溃。流动性不佳网络中的关键袜子,特别是金融部门中的重要袜子,由于其在接管和延续失去流动性方面的关键作用而被视作检查对象。市场崩溃中股票的级联失败被描述为从小程度到高程度的传播,这种程度通常位于流动性不足网络的核心,然后又回到外围。通过计算前五天随机失败的天数,可以实施早期预警来成功警告超过一半的崩溃天数,尤其是早期的连续崩溃天数。我们的结果将有助于监管机构等市场从业人员提前发现并预防崩溃的风险。




命名博弈动力学全景:

从特质竞争到贝叶斯推理


原文标题:
A Bird’s-Eye View of Naming Game Dynamics: From Trait Competition to Bayesian Inference
地址:
http://arxiv.org/abs/2004.01994
作者:
Gionni Marchetti, Els Heinsalu, Marco Patriarca

摘要:本文稿回顾了一组基本命名博弈模型的不同版本,这些版本的基础拓扑或调节主体之间交互的机制不同。我们还包括最近引入的贝叶斯命名博弈模型,该模型将基本命名博弈模型的社交动态与Tenenbaum及其同事引入的贝叶斯学习框架相结合。后一种模型通过根据贝叶斯推理的原理动态描述主体如何从几个示例中概括概念,从而超越了标准符号动力学模型的名称和概念以及相应的一次性学习过程的固定性质。




从数据推断网络结构


原文标题:

Inferring Network Structure From Data
地址:
http://arxiv.org/abs/2004.02046
作者:
Ivan Brugere, Tanya Y. Berger-Wolf

摘要:网络是用于许多应用程序域中基础数据的复杂模型。在大多数情况下,原始数据本身并不是网络形式的,而是从传感器,日志,图像或其他数据派生而来的。但是,在将这些数据转换为网络时,各种选择的影响尚未得到充分研究。在这项工作中,我们提出了一种网络模型选择方法,该方法着重于评估网络针对各种任务的效用,以及一种选择最简约模型的效率度量。我们证明了这种网络定义在建模基础系统行为的几种方式中至关重要。




隐私阴影:随着时间的

推移测量节点的可预测性和隐私


原文标题:
Privacy Shadow: Measuring Node Predictability and Privacy Over Time
地址:
http://arxiv.org/abs/2004.02047
作者:
Ivan Brugere, Tanya y. Berger-Wolf

摘要:网络数据的结构使简单的预测模型可以利用节点之间的局部相关性,以高精度执行诸如属性和链路预测之类的任务。尽管这对于建立更好的用户模型很有用,但它引起了隐私方面的顾虑,即在用户离开应用程序后,可以从网络结构中重新推断出用户的数据。我们提出了隐私阴影,用于测量用户在网络内任意时间保持预测能力的时间。此外,我们证明了可以在三个现实世界的数据集中为单个用户预测隐私阴影的长度。




设计和连接检查来自用户-

项目评分数据的隐式社会网络


原文标题:
Designing and Connectivity Checking of Implicit Social Networks from the User-Item Rating Data
地址:
http://arxiv.org/abs/2004.02166
作者:
Suman Banerjee

摘要emph 隐性社会网络是一群人之间相互联系的社会结构,如果他们有共同的兴趣,则其中两个是链接在一起的。这样的网络的一个真实的例子是在线商业商店的顾客之间的隐式社会网络,如果两个顾客喜欢相似的物品,则在他们之间存在优势。这样的网络通常可用于不同的商业应用,例如 textit 目标广告, textit 虚拟营销等。在本文中,我们研究了这个方向上的两个基本问题。第一个是,给定E  mbox -商铺的用户 mbox -商品评级数据,我们如何在其用户中设计隐式社会网络,第二个是在设计自身时我们获取用户之间的连接信息。正式地,我们将第一个问题称为 textsc 隐式用户网络设计问题,第二个问题称为 textsc 具有连接性检查的隐式用户网络设计问题。对于第一个问题,我们提出了三种不同的算法,分别是 emph 穷举搜索方法’, emph派生加法’和 textit ‘矩阵乘法 mbox -基于方法’。对于第二个问题,我们提出了两种不同的方法。第一种是顺序方法:设计然后进行连接检查,另一种是并发方法,基本上是一种同时执行设计和连接检查的增量算法。提议的方法已经对三个公开可用的评级网络数据集进行了试验,例如 emph Flixter, textit Movielens和 textit Epinions。




网页爬取中的

变化率估计和最佳新鲜度


原文标题:
Change Rate Estimation and Optimal Freshness in Web Page Crawling
地址:
http://arxiv.org/abs/2004.02167
作者:
Konstantin Avrachenkov, Kishor Patil, Gugan Thoppe

摘要:为了提供快速准确的结果,搜索引擎会维护整个网络的本地快照。而且,为了保持此本地缓存的最新状态,它使用了搜寻器来跟踪各个网页上的更改。但是,有限的带宽可用性和服务器限制对爬网频率施加了一些约束。因此,理想的爬网速率是使本地缓存的新鲜度最大化并同时遵守上述约束的速率。Azar等。2018年最近提出了一种易于处理的算法来解决此优化问题。但是,他们假设知道确切的页面更改率,这在实践中是不现实的。我们在这里解决这个问题。具体来说,我们提供了两种新颖的在线更改页面更改率方案。两种方案都只需要有关页面更改过程的部分信息,即,它们仅需要知道自上次爬网实例以来页面是否已更改。对于这两种方案,我们证明了收敛性,并且还得出了它们的收敛率。最后,我们提供了一些数值实验,以比较我们提出的估算器与现有估算器(例如MLE)的性能。




eBay 的移动指标检测和预警系统


原文标题:
Moving Metric Detection and Alerting System at eBay
地址:
http://arxiv.org/abs/2004.02360
作者:
Zezhong Zhang, Keyu Nie, Ted Tao Yuan

摘要:在eBay上,有数千个产品运行状况指标供不同领域的团队监控。我们构建了一个两阶段的警报系统,可以基于异常检测和警报检索向用户提供可操作的警报。在第一阶段,我们开发了一种有效的异常检测算法,称为移动度量检测器(MMD),以使用分布不可知的标准来识别度量之间的潜在警报。在第二个警报检索阶段,我们使用反馈构建了附加逻辑,以选择具有按点排序模型和业务规则的有效可操作警报。与其他趋势和季节性分解方法相比,我们的分解器在无人监督的情况下可以更快,更好地检测异常。我们的两阶段方法极大地提高了警报的准确性,并避免了eBay生产中的警报垃圾邮件。




复杂网络上的二元动力学:

随机成对逼近和超越


原文标题:
Binary-state dynamics on complex networks: Stochastic pair approximation and beyond
地址:
http://arxiv.org/abs/2004.02791
作者:
Antonio F. Peralta, Raul Toral

摘要:复杂网络上的二进制状态模型的理论方法通常限于无限大小的系统,在该系统中,假定一组非线性确定性方程式来表征其动力学和静态特性。在这项工作中,我们开发了不同隔室方法的随机形式,它们是:近似主方程(AME),对近似(PA)和非均质场(HMF),其准确性按降序排列。使用一般主方程的不同系统尺寸展开,我们能够获得整体状态波动和有限尺寸校正的近似解。一方面,远非确定性的确定性解决方案的偏差可以通过高斯分布很好地捕获,我们可以推导其性质,包括其相关矩阵和对平均值的校正。另一方面,在接近临界点时,存在非高斯统计特征,可以通过模型的有限尺寸尺度函数来描述。我们展示了如何获得仅偏离不同近似理论的比例函数。我们将这些技术应用于在不同情况下的各种二元状态模型,例如流行病,观点和铁磁模型。


群体智慧预测

COVID-19 传播的严重性


原文标题:
Wisdom of the crowds in forecasting COVID-19 spreading severity
地址:
http://arxiv.org/abs/2004.04125
作者:
Jeremy Turiel, Tomaso Aste

摘要:在这项工作中,我们报告说,在COVID-19大流行初期,公众对社交媒体的反应出奇地准确,其活动水平反映了将近一个月后登记的传染病数据的严重性。具体来说,疫情开始时(21-24 / 2/2020)来自意大利不同地区的COVID相关社交媒体活动的强度,很好地预测了将近一个月后(21/3/2020)的每个地区死亡总数。应当指出,在最初的推特反应发生时,尚无关于流行病的表格区域数据。到2020年2月24日,只有两个地区报告了死亡病例,只有三个报告了受感染的对象。




危机关键型知识产权:

COVID-19大流行的发现


原文标题:
Crisis-Critical Intellectual Property: Findings from the COVID-19 Pandemic
地址:
http://arxiv.org/abs/2004.03715
作者:
Frank Tietze, Pratheeba Vimalnath, Leonidas Aristodemou, Jenny Molloy

摘要:在国家和国际创新体系中,大流行病呼吁跨部门的许多行为者采取大规模行动,以动员资源,有效且大量地开发和制造危机关键型产品(CC产品)。如今,这还包括从复杂的流行病学模型AI到开放的预防,诊断和治疗数据平台的数字创新。在大流行期间的众多挑战中,创新和制造业的利益相关者发现自己正在建立新的关系,并可能面临与知识产权(IP)相关的挑战。本文采用了关于COVID-19大流行的IP观点,以确定与大流行相关的IP注意事项和IP挑战。重点在于与研究,开发和迫切需要大规模制造CC产品的能力提升相关的挑战。其目的是提供一种避免IP挑战的结构,以避免延误应对大流行病。我们确定了四个与知识产权挑战有关的利益相关者群体:(i)政府,(ii)拥有现有的“危机关键”知识产权的组织,被描述为“危机关键部门”(CC-Sector)的现有人员,(iii)其他行业的制造公司通常不生产CC产品的人突然涌入CC部门以支持CC产品(新进入者)的生产,以及(iv)在大流行期间形成的自愿基层倡议。本文讨论了与(i)预防(传播),(ii)诊断感染患者和(iii)开发治疗技术和产品有关的知识产权挑战。我们对可能的应对措施进行了初步讨论,以减少大流行期间工业利益相关者之间与知识产权相关的风险。




冠状病毒大流行期间

Twitter消息的词频和情绪分析


原文标题:
Word frequency and sentiment analysis of twitter messages during Coronavirus pandemic
地址:
http://arxiv.org/abs/2004.03925
作者:
Nikhil Kumar Rajput, Bhavya Ahuja Grover, Vipin Kumar Rathi

摘要:冠状病毒大流行已经席卷了全世界,同时也是社交媒体。随着人们对疾病意识的增强,确认其存在的信息,视频和帖子也随之增加。社交网站Twitter表现出相似的效果,与冠状病毒相关的帖子数量在很短的时间内显示出空前的增长。本文介绍了自2020年1月以来发布的与此疾病相关的twitter消息的统计分析。进行了两种类型的经验研究。第一个是关于单词频率,第二个是关于各个tweet消息的情感。检查单词频率有助于表征站点中所用单词的样式或趋势。在此关键时刻,这也将反映出Twitter用户的心理。Unigram,bigram和trigram频率已通过幂律分布建模。结果已通过平方误差总和(SSE),R2和均方根误差(RMSE)进行了验证。R2的高值和SSE和RMSE的低值为该模型的拟合优度奠定了基础。进行了情绪分析,以了解此时Twitter用户的总体态度。公众和WHO的两条推文都是该语料库的一部分。结果表明,大多数推文具有正极性,只有约15%的负极性。




流行病与遏制措施


原文标题:
Epidemics with containment measures
地址:
http://arxiv.org/abs/2004.03934
作者:
Ginestra Bianconi, Pavel L. Krapivsky

摘要:我们提出了一种包括感染控制措施在内的易感染(SI)流行病传播模型。在没有遏制措施的情况下,对于任何传染性值  lambda> 0 ,流行病的传播速度都呈指数级增长。通过考虑裸露的传染性  lambda 的时间依赖性调节来建模遏制措施,从而导致每个感染个体的有效传染性随时间衰减,例如模仿疾病的无症状发作,测试策略和隔离。对于有效的传染性,我们考虑了各种各样的时间核,我们研究了所考虑的围堵措施的效果。我们发现,并非所有内核都能将流行病动态推到流行阈值以下,而某些遏制措施只能降低新感染个体的指数增长速度。我们还提出了一个由越来越多的新分离病灶引起的大流行模型。该模型提供了一个程式化的数学框架,可以阐明不同遏制措施在减轻和抑制像COVID-19这样的流行病传播中的作用。




如何最好地预测

Covid-19 的每日新感染数


原文标题:
How to Best Predict the Daily Number of New Infections of Covid-19
地址:
http://arxiv.org/abs/2004.03937
作者:
Bernd Skiera, Lukas Jürgensmeier, Kevin Stowe, Iryna Gurevych

摘要:了解Covid-19每日新感染的每日数量非常重要,因为它是导致封锁和采取紧急医疗措施的政治决策的基础。我们以德国为例来说明官方数字的不足之处,至少在德国,这种披露仅延迟了几天,而在周末却严重漏报(超过40%)。这些缺点概述了迫切需要替代数据源。约翰·霍普金斯大学(JHU)系统科学与工程中心(JHU)提供的其他被广泛引用的消息来源,也比德国平均偏离官方数字79%。我们认为Google搜索和Twitter数据应补充官方数字。他们的预测甚至比约翰·霍普金斯大学的原始预测还要好,而且要提前几天进行。这两个数据源也可以在世界上不存在官方数字或被认为不可靠的地方使用。




评估针对 COVID-19

流行病的“信息传播”风险


原文标题:
Assessing the risks of “infodemics” in response to COVID-19 epidemics
地址:
http://arxiv.org/abs/2004.03997
作者:
Riccardo Gallotti, Francesco Valle, Nicola Castaldo, Pierluigi Sacco, Manlio De Domenico

摘要:我们的社会是建立在相互依存的复杂网络上的,这种相互依存的影响在诸如COVID-19大流行之类的特殊事件中变得很明显,其中一种系统的冲击在某种程度上蔓延到其他系统。由于SARS-CoV-2疫情,我们分析了在全球紧急情况下以64种语言发布的超过1亿条Twitter消息,并对传播的新闻的可靠性进行了分类。我们发现,一波不可靠和低质量的信息预示着这一流行病的流行,使整个国家面临不合理的社会行为和对公共卫生的严重威胁。当流行病袭击同一地区时,便会迅速接种可靠信息,例如抗体,并且系统会将重点转移到经过认证的信息来源上。与主流观点相反,我们表明人类对虚假的反应表现出预警信号,可以通过适当的沟通策略来缓解这种信号。




用于开放科学研究

的大规模COVID-19 

Twitter聊天数据集——国际合作


原文标题:
A large-scale COVID-19 Twitter chatter dataset for open scientific research — an international collaboration
地址:
http://arxiv.org/abs/2004.03688
作者:
Juan M. Banda, Ramya Tekumalla, Guanyu Wang, Jingyuan Yu, Tuo Liu, Yuning Ding, Gerardo Chowell

摘要:随着COVID-19大流行继续在全球蔓延,正在为遗传学和流行病学研究生成前所未有的开放数据。世界各地许多研究小组以无与伦比的速度发布有关正在进行的大流行的数据和出版物,这使其他科学家可以从本地经验和COVID-19大流行的前线产生的数据中学习。但是,有必要将其他数据源整合到生物医学,生物学和流行病学分析中,这些数据源将这种独特的全球性事件的社会动态图化并加以衡量。为此,我们提供了一个大型的精选数据集,该数据集与撰写本文时从1月1日到4月4日产生的COVID-19聊天有关,每天增长着1.52亿条。这个开放的数据集将使研究人员能够进行许多研究项目,这些研究涉及对社会疏远措施的情感和心理反应,错误信息来源的识别以及对大流行的情绪的分层测量。




科学专家发现的新数据集

和文档网络嵌入方法的基准


原文标题:
New Datasets and a Benchmark of Document Network Embedding Methods for Scientific Expert Finding
地址:
http://arxiv.org/abs/2004.03621
作者:
Robin Brochier, Antoine Gourru, Adrien Guille, Julien Velcin

摘要:科学文献的增长比以往任何时候都快。由于出版物数量的增加以及专业领域的不断增长,在特定的科学领域寻找专家从未像现在这样困难。为了解决这一挑战,自动专家查找算法依靠庞大的科学异构网络将文本查询与潜在的专家候选人进行匹配。在这个方向上,文档网络嵌入方法似乎是构建科学文献表示形式的理想选择。引用和作者链接包含与出版物文字内容相关的主要补充信息。在本文中,我们利用从科学引文网络和三个科学问答网站提取的数据,为文档网络中的专家发现提出了基准。我们比较了几种算法在这些不同数据源上的性能,并进一步研究了嵌入方法在专家发现任务中的适用性。




意见网络建模与实验


原文标题
Opinion Network Modeling and Experiment
地址:
http://arxiv.org/abs/2004.03757
作者:
Michael Gabbay

摘要:我们提出了一个描述由于个人网络之间的相互作用而导致的意见随时间演变的模型。该“接受-移动-收缩”(ASC)模型是根据耦合的非线性微分方程式建立的,以获取观点和不确定性。ASC模型的动态性允许多数职位的出现和持续存在,因此即使对于对称网络,平均意见也可以转移。该模型还根据最近提出的群体极化效应理论在见解和修辞之间做出区分。这样就可以对讨论引起的极端转变进行建模,而无需典型的建模假设,即对极端主义者的抗拒能力更大。描述了一个实验,其中三合会参与了在线讨论。仿真表明,ASC模型与实验数据在定性和定量上吻合。




预算约束下的社会

网络中的收益最大化


原文标题:
Earned Benefit Maximization in Social Networks Under Budget Constraint
地址:
http://arxiv.org/abs/2004.04003
作者:
Suman Banerjee, Mamata Jenamani, Dilip Kumar Pratihar

摘要:给定一个用户选择成本不一致的社会网络,  预算影响最大化(简称BIM)问题要求在分配的预算内选择一部分节点进行初始激活,例如,由于级联效应,网络中的影响力将最大化。在本文中,我们以变体形式研究此问题,其中将一组节点指定为目标节点,并为每个节点分配一个利益值,可以通过影响它们来获得收益,而我们的目标是最大限度地获得收益首先启动预算内的一组节点。我们称这个问题为 textsc 收益最大化问题。首先,我们证明这个问题是NP  mbox – Hard的,效益函数是  Independent Cascade Model扩散下的  monotone,  sub  mbox – modular。我们针对此问题提出了一种增量贪婪策略,并显示了经过细微修改后,它可以为获得的收益提供(1-  frac 1  sqrt e)  mbox -因子近似保证。接下来,通过利用利益函数的sub  mbox -模块化特性,我们提高了所提出的贪婪算法的效率。然后,我们提出了一种基于Hop  mbox -的启发式方法,该方法基于对与目标节点相对应的有效邻居的“预期收益”的计算。最后,我们使用四个真实的 mbox -生活,公开可用的社会网络数据集进行了一系列广泛的实验。从实验中,我们观察到,与许多现有方法相比,所提出的算法选择的种子集可以实现更大的收益。特别是,发现基于Hop  mbox -的方法比其他方法更有效。




印度铁路区的复杂网络分析


原文标题:
Complex Network Analysis of Indian Railway Zones
地址:
http://arxiv.org/abs/2004.04146
作者:
Nikhil Kumar Rajput, Piyush Badola, Harshit Arora, Bhavya Ahuja Grover

摘要:根据直接连接两个铁路区的列车数量,对印度铁路网进行了分析。网络已显示为加权图,其中权重表示区域之间的列车数量。可能会指出,每个区域本身就是一个复杂的网络,可能会描绘出不同的特征。因此,可以将区域网络视为复杂网络的网络。在本文中,已计算了每个区域的自链接,入度和出度,它们提供了区域间和区域内连通性的信息。还研究了度数乘客相关性,这种相关性给出了有关可能来自某个特定区域的火车和乘客数量的信息,这可能在决策制定中发挥作用。已经获得了其他一些复杂的网络参数,例如介数中心性,聚类系数和集团,以获取有关复杂的印度区域网络的更多信息。


来源:网络科学研究速递
编辑:张爽

声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。



近期网络科学论文速递


都市尺度的COVID-19爆发:它们的相似程度如何?| 网络科学论文速递31篇

自我隔离与边境封锁:什么能更好地阻止流行病传播?| 网络科学论文速递23篇
使用新闻文章和财务数据来预测破产的可能性 | 网络科学论文速递30篇
使用数据驱动的方法估算八个国家COVID-19的感染范围 | 网络科学论文速递30篇
无标度网络上的流行病传播和减缓 | 网络科学论文速递30篇

人类财富演变:趋势与波动 | 网络科学论文速递29篇

预测研究人员的合著者人数:一种学习模型 | 网络科学论文速递24篇

加入集智,一起复杂!






集智俱乐部QQ群|877391004

商务合作及投稿转载|swarma@swarma.org

◆ ◆ 

搜索公众号:集智俱乐部


加入“没有围墙的研究所”

让苹果砸得更猛烈些吧!