-
复杂网络上随机传染动力学的深度学习;
-
-
基于Moyal分布的SARS-Cov-II流行曲线的形态和数值特征;
-
COVID-19大流行期间南美的社会距离和流动性测度:必要和充分条件;
-
CRISP:基于联系数据的个人级COVID-19感染风险估计的概率模型;
-
使用纽约和新泽西州的COVID-19数据拟合基于时间的耦合SIR模型;
-
COVID-19距离措施时代,地铁服务的最佳频率设置;
-
-
-
-
-
社交媒体和COVID-19:能否在不衡量人类活动的情况下量化社会距离?;
-
关于流动性和住院能力之间的相互作用:SEIRHUD模型;
-
通过随机SEIR模型模拟法国和意大利的第二波COVID-19感染;
-
两个社区的故事:通过/r/China_Flu和/r/Coronavirus表征Reddit对COVID-19的响应;
-
-
-
-
-
Persona2vec:图的灵活多角色表示学习框架;
-
-
-
-
-
DyHGCN:动态异构图卷积网络,用于学习用户的信息扩散预测动态偏好;
-
-
-
-
-
Deep learning of stochastic contagion dynamics on complex networks
http://arxiv.org/abs/2006.05410
Charles Murphy, Edward Laurence, Antoine Allard
摘要:预测传染性动力学的发展仍然是一个悬而未决的问题,机械模型只能提供部分答案。为了保持数学和/或计算上的可操作性,这些模型必须依靠简化的假设,从而限制了其预测的定量准确性以及可以建模的动力学的复杂性。在这里,我们提出了一种基于深度学习的补充方法,其中从时间序列数据中自动学习有效的局部动力学机制。我们的图神经网络体系结构几乎没有关于动力学的假设,我们使用静态和时间网络上复杂性不断增加的随机传染动力学来证明其准确性。通过允许对任意网络结构进行仿真,我们的方法使得有可能探索训练数据以外的学习动态特性。我们的结果表明,深度学习如何为构建网络上的传染动态模型提供有效的模型,从而提供了一个新的补充视角。
Evaluation of the number of COVID-19 undiagnosed infected using source of infection measurements
http://arxiv.org/abs/2006.05194
Akiva B Melka, Yoram Louzoun
摘要:已经进行了多项研究来预测当前COVID-19流行病的影响和持续时间。这些研究大多数依赖于使用已公布确诊病例数的参数校准。不幸的是,由于缺乏测试能力和变化的测试协议,该数字通常是不完整的且有偏差。更好监控的基本要求是评估未诊断的感染个体的数量。该数字对于确定传播预防策略至关重要,它提供了流行病动态的统计数据。为了估计未诊断的感染个体的数量,我们研究了所有感染者中诊断出的感染者比例与所有诊断出的感染者中被已知污染物感染的比例之间的关系。我们模拟了当前用于研究COVID-19大流行的多个模型,并在所有这些模型中计算了这两个部分之间的关系。在当前使用的大多数模型中,对于大多数实际的模型参数,两个部分之间的关系始终是线性的,并且与模型无关。这种关系可以用来估计未诊断的感染人数,而无需明确的流行病学模型。我们采用这种方法来衡量以色列未确诊的感染人数。由于可以从任何国家的流行病学调查中获得已知来源的确诊病例的比例,因此可以估算出同一国家的受感染个体总数。
基于Moyal分布的
SARS-Cov-II流行曲线的形态和数值特征
Morphology and numerical characteristics of epidemic curves for SARS-Cov-II using Moyal distribution
http://arxiv.org/abs/2006.04954
Jose de Jesus Bernal-Alvarado, David Delepine (Guanajuato University)
摘要:本文表明,Moyal分布是研究SARS-Cov-II(Covid-19)流行病学相关曲线及其传播的出色工具。Moyal参数提供所有信息,以描述疾病暴发在不同受灾国家的形式和影响及其全球影响。我们检查了Moyal分布是否可以准确地拟合每个国家/地区 it 新确诊的受感染病例(NCC)的每日报告,这些地方的传染病已达到其最终阶段,描述了开始,最强烈传染的同时阶段和下降阶段。为了实现这项工作的目的,重要的是要使用一组完整且经过良好编译的数据来拟合曲线。已使用来自法国,西班牙,意大利,比利时,瑞典,英国,丹麦等欧洲国家的数据,以及美国和中国等其他国家的数据。此外,还讨论了Moyal分布拟合的参数与各国实施的一般公共卫生措施之间的相关性。显示了这些政策与Moyal分布特征之间的关系(根据其参数和临界点);从中可以看出,对流行病学曲线的时间演变,其临界点,叠加特性以及上升和下降的速率的了解,可以帮助找到一种方法来估计所施加的社会疏离措施的效率。在每个国家/地区,并预测大流行的不同阶段。
COVID-19大流行期间南美的社会距离
和流动性测度:必要和充分条件
Medidas de distanciamento social e mobilidade na Am’erica do Sul durante a pandemia por COVID-19: Condic{c}~oes necess’arias e suficientes?
http://arxiv.org/abs/2006.04985
Gisliany Lillian Alves de Oliveira, Luciana Conceição de Lima, Ivanovitch Silva, Marcel da Câmara Ribeiro-Dantas, Kayo Henrique Monteiro, Patricia Takako Endo
摘要:在没有用于COVID-19的疫苗的情况下,必须采取非药物干预措施来遏制病毒的传播以及受影响地区卫生系统的崩溃。这些措施之一是社会疏远,其目的是通过关闭涉及人群的公共和私人场所来减少社区中的互动。封锁的前提是社区互动的急剧减少,这是衡量社会距离的一种更为极端的方法。根据Google提供的六类物理空间的地理位置数据,本文确定了在COVID-19大流行期间采取的不同类型的社会疏远措施,南美人流的变化。在这项研究中,分析了一组国家在2020年2月15日至2020年5月16日之间的人口流动趋势。为了用单一度量标准总结这些趋势,创建了一个总的循环指数,并使用区域自相关性(全局和局部Moran指数)的描述性分析来确定区域流动性模式。这项研究的第一个假设是,拥有封锁令的国家在减少人口流动方面可以取得更大的成功,第二个假设是阿根廷,巴西和哥伦比亚具有区域流动模式。第一个假设得到了部分确认(考虑了南美的10个国家),空间分析获得的结果证实了第二个假设。总体而言,观察到的数据表明,没有必要采取较严格的封锁或社会隔离措施,但这不足以大幅度减少大流行期间的人员流动。
CRISP:基于联系数据的个人级
COVID-19感染风险估计的概率模型
CRISP: A Probabilistic Model for Individual-Level COVID-19 Infection Risk Estimation Based on Contact Data
http://arxiv.org/abs/2006.04942
Ralf Herbrich, Rajeev Rastogi, Roland Vollgraf
摘要:我们介绍了CRISP(COVID-19风险评分预测),这是一种基于SEIR模型的,通过人群传播的COVID-19感染的概率图模型,我们假设会访问(1)跨时间跨各种渠道的成对个体之间的相互联系(例如,蓝牙接触迹线),以及(2)在给定时间进行感染,暴露和免疫测试的测试结果。我们的微观模型跟踪每个人在每个时间点的感染状态,范围从易感,暴露,感染到恢复。我们开发了一种蒙特卡洛EM算法来推断接触通道的特定感染传播概率。我们的算法使用吉布斯采样法,在给定所有接触者的潜伏感染状态和测试结果数据的情况下,在整个分析时间内绘制每个人的潜伏感染状态的样本。模拟数据的实验结果表明,可以通过繁殖因子 R_0 对我们的CRISP模型进行参数化,并显示出与经典SEIR模型相似的种群水平传染性和恢复时间序列。但是,由于有单独的联系数据,该模型可以对各种COVID-19缓解和抑制策略措施进行细粒度的控制和推断。此外,该算法能够以测试痕迹隔离方法支持包含COVID-19感染传播的有效测试。据我们所知,这是第一个基于个人联系数据有效推断COVID-19感染传播的模型。大多数流行病模型都是在整个人群中进行推理的宏观模型。可以在https://github.com/zalandoresearch/CRISP中使用Python和C ++获得CRISP的实现。
使用纽约和新泽西州的COVID-19数据
拟合基于时间的耦合SIR模型
On a coupled time-dependent SIR models fitting with New York and New-Jersey states COVID-19 data
http://arxiv.org/abs/2006.05665
Benjamin Ambrosio, M.A. Aziz-Alaoui
摘要:本文介绍了一个简单的易感感染恢复(SIR)模型,该模型与2020年3月在纽约(NY)州的COVID-19数据拟合。该模型是经典的SIR,但非自治。随时间调整易感染人群的感染率,以适应可用数据。死亡率也进行了二次调整。我们的拟合是在以下假设下进行的:由于测试数量有限,因此大部分感染人群的测试结果均为阴性。在最后一部分中,我们扩展模型以考虑新泽西州(NJ)和纽约州之间的每日通量,并拟合这两个州的数据。我们的简单模型拟合了可用数据,并说明了该疾病的典型动态:指数增加,顶点和减少。该模型突出显示了这段时期内传播率的下降,从而定量说明了锁定政策如何减少大流行的蔓延。具有NY和NJ状态的耦合模型显示了在NY波浪之后的NJ波浪,说明了从一个有吸引力的热点传播到其邻近点的机制。
COVID-19距离措施时代,
地铁服务的最佳频率设置
Optimal frequency setting of metro services in the age of COVID-19 distancing measures
http://arxiv.org/abs/2006.05688
Konstantinos Gkiotsalitis, Oded Cats
摘要:公共交通是COVID-19大流行中受干扰最大的部门之一,据报告,在受灾最严重的国家,乘客数量下降了90%。随着许多政府当局努力部分恢复活动,公共交通运营商迫切需要能够评估不同的社会疏远政策对运营和乘客相关成本的影响的模型。在这项研究中,我们引入了混合整数二次规划模型,用于通过评估不同的社会疏远政策的影响来考虑运营,乘客和收入损失相关成本的公共交通服务的重新设计。我们的模型应用于华盛顿特区的地铁网络,并针对不同的社会距离场景提供了跨线车辆的最佳再分配。该模型可以被需要评估与实施不同社会疏远政策相关的成本的其他决策者和公共交通运营商用作决策支持工具。
Optimal immunity control by social distancing for the SIR epidemic model
http://arxiv.org/abs/2006.05733
Pierre-Alexandre Bliman (MAMBA, LJLL), Michel Duprez (CEREMADE), Yannick Privat (IRMA, TONUS), Nicolas Vauchelet (LAGA)
摘要:在找到针对SARS-CoV-2冠状病毒的疫苗或疗法之前,达到群体免疫似乎是唯一的中期选择。但是,如果感染个体的数量减少并且最终仅在超过此阈值时才逐渐消失,那么在流行病结束之前,仍有相当一部分易感者可能仍被感染。在没有发现疫苗或疗法的最坏情况下,遏制策略可能是最好的策略。为了将新感染者的数量保持在最低水平,一种可行的策略是采取严格的收容措施,以使易感人群的数量保持接近畜群免疫的水平。这样的行动是不现实的,因为遏制只能持续有限的时间,而且永远不会完全。在本文中,我们使用经典的SIR模型,在给定的有限时间间隔内确定(部分或全部)遏制策略,该策略将在无限远的时间范围内最大化易感个体的数量,或者等效地最小化在受诅咒期间的总感染负担流行。证明了最优策略的存在性和唯一性,并对后者进行了充分的表征。如果在实践中可行,则这种策略在理论上将导致无限远期的易感人群比例增加30%,达到与2020年3月至2020年5月法国实施的卫生措施相对应的遏制水平。达到与畜群免疫力固定距离的最短干预时间,并显示与先前问题的关系。提供的仿真说明和验证了理论结果。
Aging and relaxation in bistable contagion dynamics
http://arxiv.org/abs/2006.05937
Paul Richter, Malte Henkel, Lucas Böttcher
摘要:对于一般的传染模型,分析了后期松弛动力学。在此模型中,节点处于活动状态或失败。如果活动节点的邻域受到充分破坏,则它们可以随时自发”或外部’’失效。失败的节点可能始终会自发恢复。在后期,打破时间平移不变性是物理老化的必要条件。的确,我们观察到,初始条件位于模型的两个稳定平稳状态之间,初始条件失去了时间平移不变性。基于相应的平均场预测,我们通过相图来表征观察到的模型行为,相图由自发和外部故障节点的分数所覆盖。对于正方形晶格,由于空间相关效应,动力学接近两个稳定稳态之一的相位不可线性分离。我们的结果提供了对老化和松弛现象的新见解,这些现象可以在一般的传染过程模型中观察到。
A predictive model for Covid-19 spread applied to six US states
http://arxiv.org/abs/2006.05955
Zeina S. Khan, Frank Van Bussel, Fazle Hussain
摘要:提出了一种隔间流行病模型来预测Covid-19病毒的传播。它考虑了:已发现和未发现的感染人群,医疗隔离和社会隔离,以及可能的再次感染。通过拟合美国六个州(加利福尼亚州,路易斯安那州,新泽西州,纽约州,德克萨斯州和华盛顿州)的经验数据来评估模型中的系数。各州之间Covid-19的演变非常相似:接触率和检测率保持在5%以下;但是,死亡率,恢复率和在家中的影响差异较大。结果表明,在首次发现之前,几个州可能已经在爆发禽流感,而且某些西方州可能已经目睹了多次流感大流行。对于大多数州,该模型的有效繁殖数略高于一个临界值,这表明Covid-19将成为地方病,传播超过两年。如果取消在家中使用的订单,大多数州可能会经历每年一次的振荡感染。即使在得克萨斯州实施了其他封锁措施,然后根据白宫关于减少案件14天的准则予以释放,也可能发生类似的地方性情况。此外,如果提前一到三周进行锁定,纽约的Covid-19死亡人数可能会大大减少,但得克萨斯州却没有。
Global Data Science Project for COVID-19 Summary Report
http://arxiv.org/abs/2006.05573
Dario Garcia-Gasulla, Sergio Alvarez Napagao, Irene Li, Hiroshi Maruyama, Hiroki Kanezashi, Raquel P’erez-Arnal, Kunihiko Miyoshi, Euma Ishii, Keita Suzuki, Sayaka Shiba, Mariko Kurokawa, Yuta Kanzawa, Naomi Nakagawa, Masatoshi Hanai, Yixin Li, Tianxiao Li
摘要:本文旨在提供COVID-19的全球数据科学项目(GDSC)的摘要。截至2020年5月31日。COVID-19通过应对病毒传播的政策措施所产生的直接和间接影响,对我们的社会产生了重大影响。我们定量分析了COVID-19大流行对我们社会的多方面影响,包括人们的出行,健康和社会行为变化。由于出行限制和检疫措施的实施,人们的流动性发生了巨大变化。实际上,物理距离在国际(跨境),国家和地区级别上已经扩大。在国际层面,由于旅行限制,三月份国际航班总数总体下降了约88%。特别是,3月中旬,美国宣布对欧洲和欧盟的旅行限制,而与会国同意关闭边界后,连接欧洲的航班数量急剧下降,与3月10日相比下降了84%。同样,我们研究了检疫措施对主要城市的影响:东京(日本),纽约(美国)和巴塞罗那(西班牙)。在所有三个城市中,我们发现交通量显著下降。我们还通过分析社会网络服务(例如Twitter和Instagram)上的帖子,确定了人们对心理健康的日益关注。值得注意的是,在2020年4月开始,Instagram上带有#depression的帖子数量增加了一倍,这可能反映出Instagram用户中心理健康意识的提高。此外,我们通过对Instagram数据和主要调查数据的分析,确定了人们广泛的社会行为的变化以及经济影响。
社交媒体和COVID-19:
能否在不衡量人类活动
的情况下量化社会距离?
Social Media and COVID-19: Can Social Distancing be Quantified without Measuring Human Movements?
http://arxiv.org/abs/2006.05316
Mackenzie Anderson, Amir Karami, Parisa Bozorgi
摘要:COVID-19爆发对国际卫生和经济构成了重大威胁。在未对此病毒进行治疗的情况下,公共卫生官员要求公众进行社交疏导,以减少身体接触的次数。但是,量化社会距离是一项艰巨的任务,当前的方法是基于人类的运动。我们提出了一种节省时间和成本的方法来衡量人们如何实践社会疏离。这项研究提出了一种利用标签标签频率支持和鼓励社会距离来衡量社会距离的新方法。我们已经确定了18个相关的标签,并跟踪了它们在2020年1月至2020年5月之间的趋势。我们的评估结果表明,我们的发现与Google社交距离报告之间存在很强的相关性(P <0.05)。
关于流动性和住院能力之间
的相互作用:SEIRHUD模型
On the interplay between mobility and hospitalization capacity: The SEIRHUD model
http://arxiv.org/abs/2006.05357
Tomas Veloz, Pedro Maldonado, Samuel Ropert, Cesar Ravello, Soraya Mora, Alejandra Barrios, Tomas Villaseca, Cesar Valdenegro, Tomas Perez-Acle
摘要:减少COVID19影响的措施需要综合后勤,政治和社会能力。视国家/地区而定,观察到增加住院治疗或适当实施锁定措施的能力有所不同。为了更好地理解这些措施的影响,我们开发了一个隔间模型,一方面可以校准不同区域内和不同区域之间人员流动的减少,另一方面,它结合了住院动态来区分感染者可以接受的各种治疗方法。通过限制住院能力,我们可以详细研究流动性和住院能力之间的相互作用。
通过随机SEIR模型模拟法国
和意大利的第二波COVID-19感染
Modelling the second wave of COVID-19 infections in France and Italy via a Stochastic SEIR model
http://arxiv.org/abs/2006.05081
Davide Faranda, Tommaso Alberti
摘要:COVID-19已在全球多个国家/地区强制实施了隔离措施。事实证明,这些措施可有效减少病毒的流行。迄今为止,尚无有效的治疗方法或疫苗。为了维护公共卫生以及经济和社会结构,法国和意大利政府已部分解除锁定措施。在这里,我们使用易感暴露-感染-恢复(SEIR)模型推断这两个国家的流行病的长期行为,该模型会随机扰动参数以处理COVID-19流行率估计中的不确定性。我们的结果表明,参数和初始条件的不确定性都会在模型中迅速传播,并且可能导致流行病的不同结果,导致或不引起第二波感染。使用实际知识,在两个国家中,COVID-19流行率的渐近估计可能会波动一千万个单位。
两个社区的故事:
通过/r/China_Flu和/r/Coronavirus
表征Reddit对COVID-19的响应
A Tale of Two Communities: Characterizing Reddit Response to COVID-19 through /r/China_Flu and /r/Coronavirus
http://arxiv.org/abs/2006.04816
Jason Shuo Zhang, Brian C. Keegan, Qin Lv, Chenhao Tan
摘要:COVID-19大流行严重影响了全球人们的生活。在大流行造成的长期封锁期间,在线社区对于人们访问信息和分享经验至关重要。特别是在Reddit上出现了两个“新”社区:/ r / China_flu和/ r / Coronavirus。通过研究这两个社区中的活动和用户,我们可以表征人们对Reddit上COVID-19的反应。首先,我们发现用户活动在3月17日左右达到高峰,当时世界卫生组织(WHO)宣布COVID-19为大流行病。此后不久,两个社区的活动水平逐周下降。我们进一步说明了这两个社区在COVID相关社区的出现中的核心作用。其次,我们研究了这两个社区之间的差异。建议在Reddit上将/ r / Coronavirus作为COVID-19的官方社区,而/ r / China_flu采用宽松的管理措施。结果,我们发现这两个社区正在逐渐分化,并且在/ r / China_flu中发现了更多的极端主义。最后,我们研究了整个Reddit平台上COVID-19大流行对用户活动的溢出效应。我们的结果表明,与COVID相关的社区之外的用户活动发生了重大变化。在与金融,食品和国家/城市有关的子目录中,随着国家的重新开放,用户活动在4月下旬和5月恢复到大流行前的水平,但是与旅行和体育相关的子目录仍然受到严重影响,活动水平低于前者。大流行期。我们的工作突显了Reddit作为了解公众对COVID-19的反应的来源的力量,以及在大流行期间Internet上的内容审核的重要性。
Hysteresis Effects in Social Behavior with Parasitic Infection
http://arxiv.org/abs/1910.09746
摘要:最近的工作发现,被寄生虫感染时,个体的行为可以改变。在这里,我们探讨一个问题:原则上,一般情况下,一般性寄生虫感染能否控制整个系统的社会行为?我们在Master方程下分析固定点和滞后效应,在总体保持固定的总体中,在给定两个不同的亚人群(健康人群与寄生虫感染人群)的两种行为之间进行转换。关键的模型选择是:(i)被感染人类的内部意见可能与健康人群的内部意见不同,(ii)相互作用驱动行为改变的程度也可能不同,并且(iii)间接相互作用最为重要。我们发现,在某些情况下,即使健康人群占多数并且持相反意见,但受寄生虫感染的人群可以控制社会结构。
Hierarchical Large-scale Graph Similarity Computation via Graph Coarsening and Matching
http://arxiv.org/abs/2005.07115
Haoyan Xu, Runjian Chen, Yunsheng Bai, Jie Feng, Ziheng Duan, Ke Luo, Yizhou Sun, Wei Wang
摘要:在这项工作中,我们专注于大型图相似性计算问题,并提出了一种新颖的嵌入-粗化-匹配”学习框架,该框架在此任务中优于最新方法,并且在时间效率上有显著改善。诸如“图编辑距离”(GED)之类的度量的图相似性计算通常是NP难的,并且现有的基于启发式的算法通常会在准确性和效率之间取得不令人满意的折衷。最近,深度学习技术的发展通过一种数据驱动的方法为该问题提供了一个有前途的解决方案,该方法训练网络将图编码为它们自己的特征向量并基于特征向量计算相似度。这些深度学习方法可以分为两类:嵌入模型和匹配模型。直接将图映射到相应特征向量的嵌入式模型(例如GCN-Mean和GCN-Max)运行速度更快,但是由于缺乏跨图的交互作用,因此性能通常很差。匹配模型(例如GMN)的编码过程涉及两个图之间的交互,这种模型更准确,但整个图之间的交互会显著增加时间消耗(至少在节点数上为二次时间复杂度)。受到大型生物分子鉴定的启发,首先将整个分子映射到官能团,然后根据这些官能团进行鉴定,我们的嵌入-粗化-匹配’’学习框架首先将大图嵌入和粗化为具有密集局部拓扑的粗化图然后将匹配机制部署到粗化图上以获得最终相似度得分。已经进行了详细的实验,结果证明了我们提出的框架的效率和有效性。
On the Gap between Scalar and Vector Solutions of Generalized Combination Networks
http://arxiv.org/abs/2006.04870
Hedongliang Liu, Hengjia Wei, Sven Puchinger, Antonia Wachter-Zeh, Moshe Schwartz
摘要:我们研究广义组合网络的标量线性和向量线性解。我们根据网络参数和字母大小在中间层的最大节点数上得出新的上限和下限。这些界限改善并扩展了已知界限的参数范围。使用这些新界限,我们在最佳标量线性和最佳矢量线性网络编码解决方案之间的字母大小的间隙中给出了一个下限和一个上限。对于固定的网络结构,在更改中间层节点 r 的数量的同时,上下界的渐近行为表明间隙位于 Theta( log(r))中。
Analysis of node2vec random walks on networks
http://arxiv.org/abs/2006.04904
Lingqi Meng, Naoki Masuda
摘要:事实证明,随机游走对于构建各种算法以获取网络信息很有用。算法node2vec使用有偏的随机游走将节点嵌入到低维空间中,然后可以将其用于多标签分类和链路预测等任务。在这些应用程序中,node2vec的有用性被认为取决于node2vec算法使用的随机游走的属性。在本研究中,我们在理论和数值上分析了node2vec使用的随机游动。node2vec随机游走是二阶马尔可夫链。我们利用其转移规则到有向边之间的转移概率矩阵的映射来分析平稳概率,弛豫时间和合并时间。特别是,我们提供了大量证据,证明当调整其参数时,node2vec随机游走会加快扩散,从而使步行者避免回溯和访问先前访问的节点的邻居,但又不过分。
Persona2vec:
图的灵活多角色表示学习框架
Persona2vec: A Flexible Multi-role Representations Learning Framework for Graphs
http://arxiv.org/abs/2006.04941
Jisung Yoon, Kai-Cheng Yang, Woo-Sung Jung, Yong-Yeol Ahn
摘要:学习图的低维表示的图嵌入技术正在许多图挖掘任务中实现最先进的性能。大多数现有的嵌入算法都会为每个节点分配一个向量,隐式地假设单个表示足以捕获该节点的所有特征。但是,在许多域中,通常会观察到普遍重叠的社区结构,其中大多数节点属于多个社区,并根据上下文扮演不同的角色。在这里,我们提出了persona2vec,这是一种图嵌入框架,可以根据节点的结构上下文有效地学习节点的多种表示形式。使用基于链路预测的评估,我们表明我们的框架比现有的最新模型快得多,同时实现了更好的性能。学习图的低维表示的图嵌入技术正在许多图挖掘任务中实现最先进的性能。大多数现有的嵌入算法都会为每个节点分配一个向量,隐式地假设单个表示足以捕获该节点的所有特征。但是,在许多域中,通常会观察到普遍重叠的社区结构,其中大多数节点属于多个社区,并根据上下文扮演不同的角色。在这里,我们提出了persona2vec,这是一种图嵌入框架,可以根据节点的结构上下文有效地学习节点的多种表示形式。使用基于链路预测的评估,我们表明我们的框架比现有的最新模型快得多,同时实现了更好的性能。
Network visualizations with Pyvis and VisJS
http://arxiv.org/abs/2006.04951
Giancarlo Perrone, Jose Unpingco, Haw-minn Lu
摘要:Pyvis是一个Python模块,可在Jupyter笔记本中或作为独立的Web应用程序可视化和交互操作网络图。Pyvis建立在功能强大且成熟的VisJS JavaScript库的基础上,该库可实现快速响应的交互,同时还提取了底层JavaScript和HTML。这意味着可以在Python中指定呈现的图可视化的元素(例如节点/边属性),并将其运送到JavaScript层以供VisJS呈现。这种声明性方法使快速浏览图可视化和调查数据关系变得容易。此外,Pyvis具有高度可定制性,因此可以将颜色,大小和悬停工具提示分配给渲染的图。网络图的布局由前端物理引擎控制,该引擎可从Python界面配置,从而可以详细放置图元素。在本文中,我们用特定的示例概述了Pyvis的用例,以突出显示任何分析工作流程的关键功能。Pyvis实现的简要概述描述了Python前端绑定如何使用简单的Pyvis调用。
The Structure of U.S. College Networks on Facebook
http://arxiv.org/abs/2006.04980
Jan Overgoor, Bogdan State, Lada Adamic
摘要:有趣的是,在大学中建立的社会联系具有终生影响。然而,在大学中形成的社会网络知识仍然是偶然的,这在很大程度上是由于收集合适的数据集进行全面分析所涉及的困难和费用。为了提高对大学社会网络的了解并将其系统化,我们描述了美国大学生使用的最大的在线社会网络平台的数据集。我们将已取消识别和汇总的Facebook数据与美国大学教育部提供的大学记分卡数据,大学记分卡数据相结合,以生成涵盖1760个美国大学和大学的2008-2015入学年队列的数据集,涵盖760万学生。为了完成比较这些不同规模的网络的艰巨任务,我们开发了一种新的方法。我们通过采样的自我图计算特征,为每对图训练二进制分类器,并将图之间的距离作为预测精度进行运算。同一所学校不同年份的社会网络在结构上比其他学校的社会网络彼此更相似。来自类似学校的网络具有类似的结构,其中最明显的是公立/私立和毕业率维度。我们还将学校类型与特定结果联系起来。例如,私立学校的学生拥有更大的网络,这些网络更加集群化,同年同质性更高。我们的发现可能有助于阐明大学在塑造社会网络中所扮演的角色,这些社会网络在人们的一生中一直存在。
The Hitchhiker’s Guide to the All-Interval 12-Tone Rows
http://arxiv.org/abs/2006.05007
Marco Buongiorno Nardelli
摘要:本文回顾了所有间隔的12音系列(AIS)的生成,分类和分类。受1974年Morris和Starr的开创性工作(Morris和Starr,1974年全间隔结构的结构)的启发,它使用复杂的网络理论扩展了他们的分析,并为作曲家和理论家提供了将所有AIS链接在一起的重新排序方案。通过关系链。
Nonlinear walkers and efficient exploration of congested networks
http://arxiv.org/abs/2006.05146
Timoteo Carletti, Malbor Asllani, Duccio Fanelli, Vito Latora
摘要:随机游走是探索或搜索图的最简单方法,并且揭示了一种非常有用的工具,可以研究和表征现实世界中复杂网络的结构特性,例如它们已用于识别给定网络的模块,其最中心的节点和路径,或确定达到目标的典型时间。尽管已经提出了各种类型的随机行走,其运动是节点偏向的,但仍然适用于解析解,但大多数(如果不是全部)依赖于行走者的线性和独立性的假设。我们介绍了一类新的非线性随机过程,该过程描述了在具有有限节点容量的网络上移动的随机游走者之间相互作用的系统。转移概率由目标节点上可用空间的非线性函数调制,并带有一个偏差参数,该偏差参数允许调整助步器的趋势以避免其他助步器占用的节点。首先,我们推导了控制系统动力学的主方程,并确定了在最一般情况下以及网络拥挤程度不同的情况下,步行者处于平衡状态的占用概率的解析表达式。然后,我们研究了不同类型的合成网络和真实世界的网络,并给出了熵率的数值和分析结果,并以此作为步行者网络探索能力的主体。我们发现,对于每个非线性偏差水平,都有一个在给定网络拓扑中最大化熵率的最佳拥挤。分析表明,现实世界中的大部分网络都是以拥挤条件下的勘探为导向的。我们的工作提供了一个通用且通用的框架来建模非线性随机过程,其过渡概率随系统当前状态的变化而变化。
DyHGCN:
动态异构图卷积网络,
用于学习用户的信息扩散预测动态偏好
DyHGCN: A Dynamic Heterogeneous Graph Convolutional Network to Learn Users’ Dynamic Preferences for Information Diffusion Prediction
http://arxiv.org/abs/2006.05169
Chunyuan Yuan, Jiacheng Li, Wei Zhou, Yijun Lu, Xiaodan Zhang, Songlin Hu
摘要:信息扩散预测是了解信息传播过程的基本任务。它在错误信息传播预测和恶意帐户检测等方面具有广泛的应用。先前的工作要么集中于利用单个扩散序列的上下文,要么将用户之间的社会网络用于信息扩散预测。但是,不同消息的扩散路径自然会构成一个动态扩散图。一方面,以前的工作无法同时利用社会网络和扩散图进行预测,这不足以对扩散过程的复杂性进行建模,从而导致预测性能不尽人意。另一方面,他们无法学习用户的动态偏好。直观地,随着时间的流逝,用户的偏好会发生变化,而用户的个人偏好决定了用户是否会重新发布信息。因此,在信息扩散预测中考虑用户的动态偏好是有益的。在本文中,我们提出了一种新颖的动态异构图卷积网络(DyHGCN),以共同学习社交图和动态扩散图的结构特征。然后,我们将时间信息编码到异构图中,以学习用户的动态偏好。最后,我们运用多头注意力来捕获当前扩散路径的上下文相关性,以促进信息扩散预测任务。实验结果表明,DyHGCN在三个公共数据集上的性能明显优于最新模型,从而证明了该模型的有效性。
Explainable Classification of Brain Networks via Contrast Subgraphs
http://arxiv.org/abs/2006.05176
Tommaso Lanciano, Francesco Bonchi, Aristides Gionis
摘要:挖掘人脑网络以发现可用于区分健康个体和受某些神经系统疾病影响的患者的模式,是神经科学的一项基本任务。学习简单且可解释的模型与单纯的分类准确性一样重要。在本文中,我们介绍了一种基于提取对比子图(即一组顶点的集合)的新方法,该方法用于对脑网络进行分类。我们正式定义问题并提出用于提取对比子图的算法解决方案。然后,我们将我们的方法应用于由自闭症谱系障碍患儿和典型发育儿童所组成的大脑网络数据集。我们的分析证实了所发现模式的有趣之处,这些模式与神经科学文献中的背景知识相匹配。对其他分类任务的进一步分析证实了我们提案的简单性,稳健性和高可解释性,对于更复杂的最新方法,该提案还具有出色的分类准确性。
Re-evaluating phoneme frequencies
http://arxiv.org/abs/2006.05206
Jayden L. Macklin-Cordes, Erich R. Round
摘要:因果过程可以在它们影响的语言变量中引起独特的分布。因此,对变量分布的可靠了解可以成为理解导致其成因的力的关键。语言学中的分层分布一直是Zipf定律,这是一种幂定律。在围绕幂律假设进行科学界的一场激烈辩论以及较早的评估它们的方法的不可靠性之后,我们在这里重新评估声称表征音素频率的分布。我们使用最大似然框架推论幂律法和三种替代分布对168种澳大利亚语言的拟合。我们发现支持早期结果的证据,但也对它们进行了限定和细化。最值得注意的是,音素库在其最频繁的成员中似乎具有类似于Zipfian的频率结构(尽管也可能是对数正态结构),但在最不频繁的成员中具有几何(或指数)结构。我们强调因果关系的含义。
Detecting structural perturbations from time series with deep learning
http://arxiv.org/abs/2006.05232
Edward Laurence, Charles Murphy, Guillaume St-Onge, Xavier Roy-Pomerleau, Vincent Thibeault
摘要:较小的干扰会触发复杂系统中的功能故障。一项具有挑战性的任务是推断网络系统中引起干扰的结构原因,并尽快防止发生灾难。我们提出了一种图神经网络方法,该方法借鉴了深度学习范式,可以从功能时间序列中推断出结构扰动。我们展示了我们的数据驱动方法在满足贝叶斯推理的准确性的同时胜过了典型的重建方法。我们通过各种网络结构上的流行病传播,种群动态和神经动力学来验证我们方法的多功能性和性能:随机网络,无标度网络,25个实际食物网络系统和秀丽隐杆线虫的连接组。此外,我们报告说,我们的方法对于数据损坏是可靠的。这项工作揭示了研究现实世界复杂系统的弹性的实用途径。
Tropes in films: an initial analysis
http://arxiv.org/abs/2006.05380
Rubén Héctor García-Ortega, Pablo García Sánchez, Juan J. Merelo-Guervós
摘要:TVTropes是一个维基百科,描述了比喻以及在哪些艺术作品中使用了哪些。我们对电影最感兴趣,因此在发布了TropeScraper Python模块(从该站点提取数据)后,在本报告中,我们使用了抓取的信息来统计地描述trops和电影之间的相互关系以及这些关系如何随时间演变。为此,我们于2020年4月通过工具TropeScraper生成了一个数据集。我们将其与DB Tropes的最新快照进行了比较,后者是涵盖同一站点并于2016年7月发布的数据集,提供了描述性分析,研究了基本差异并根据比喻的数量,电影和联系的数量来解决Wiki的发展。结果表明,视线和胶片的数量使它们的值增加了一倍,并且它们的关系增加了四倍,并且从总体上来说,用视线可以更好地描述胶片。然而,尽管具有最多的方言的电影类型多年来没有显著变化,但最受欢迎的方言的列表却发生了变化。这一结果可以帮助我们了解流行的比喻如何演变,哪些变得更流行或逐渐消失,以及总体而言,一组比喻如何代表电影,并可能是其成功的关键。所生成的数据集,所提取的信息以及所提供的摘要对于涉及电影和电影的任何研究都是有用的资源。它们可以提供有关在数据集之上构建的模型的行为的适当上下文和解释,包括生成新内容或将其用于机器学习。
Fair Clustering for Diverse and Experienced Groups
http://arxiv.org/abs/2006.05645
Ilya Amburg, Nate Veldt, Austin R. Benson
摘要:机器学习加剧偏见的能力导致了许多以公平为中心的算法。例如,公平集群算法通常专注于集群内受保护属性的均衡表示。在这里,我们开发了一个公平的聚类变体,其中输入数据是具有多种边类型的超图,表示有关个人群体过去经验的信息。我们的方法基于经验的多样性,而不是受保护的属性,目的是形成在参与边类型方面既具有经验又具有多样性的组。我们使用基于边的正则化聚类目标对该目标进行建模,设计用于优化NP硬目标的高效2近似算法,并提供超参数的边界以避免平凡的解决方案。我们演示了此框架在在线评论平台中的潜在应用,该平台的目标是针对产品类型策划用户评论集。在这种情况下,“经验”对应于熟悉产品类型的用户,“多样性”对应于已查看相关产品的用户。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。
集智俱乐部QQ群|877391004
商务合作及投稿转载|swarma@swarma.org
搜索公众号:集智俱乐部
加入“没有围墙的研究所”
让苹果砸得更猛烈些吧!