本文由机器翻译,仅供参考,感兴趣请查阅论文原文

核心速递


  • 网络的动力学预测几乎不依赖于拓扑;

  • 分析在线社交媒体上的COVID-19:趋势,情感和情绪;

  • 测试可以放松社会隔离措施吗?纽约市COVID-19的未来发展;

  • 包含检疫效应的新型SEIR类型模型及其在2020年3月至4月波兰Covid-19大流行病分析中的应用;

  • 武汉、多伦多和意大利新兴COVID-19流行病的数据驱动网络模型;

  • 通过人工智能提高社区的弹性和应急响应能力;

  • 注意力:为了更好地站在巨人的肩膀上;

  • 亲密伴侣监视中使用的工具和策略:在线不忠论坛的分析;

  • 期刊级引文网络中的无监督异常检测;

  • 范围可调节的电流中心性;

  • 航空运输网络发展中的复发现象;

  • 考虑公平的链接分析;

  • 捷克电网中的电力线和变压器对地磁风暴的即时和延迟响应;

  • 多层网络中的轨迹聚类:确定帕金森子类型;

  • 图数据库中的多维事件数据;

  • 社会系统中基于网络的排名:三个挑战;

  • 是否可以终止流行病的传播?动态蒙特卡洛方法;

  • 平等和公正的数字货币网络;

  • 节点分类中节点嵌入方法的评估过程;

  • 单隶属系统的第3级网络表示;




网络的动力学预测几乎不依赖于拓扑


原文标题:

Predicting Dynamics on Networks Hardly Depends on the Topology

地址:

http://arxiv.org/abs/2005.14575

作者:

Bastian Prasse, Piet Van Mieghem


摘要:网络上的过程由两个相互依赖的部分组成:网络拓扑(由节点之间的链接组成)和动力学(由某些控制方程式指定)。这项工作基于对动力学的过去观察,考虑了未知网络上未来动力学的预测。对于一类通用的控制方程,我们提出了一种预测算法,该算法将网络作为中间步骤。由于线性系统的严重缺陷,实际上无法推断网络。出乎意料的是,仍然可以对动力学进行高度准确的预测:尽管推断的网络与真实网络没有拓扑相似性,但是两个网络实际上都具有相同的未来动力学。



分析在线社交媒体上的COVID-19:

趋势,情感和情绪


原文标题:

Analyzing COVID-19 on Online Social Media: Trends, Sentiments and Emotions

地址:

http://arxiv.org/abs/2005.14464

作者:

Xiaoya Li, Mingxin Zhou, Jiawei Wu, Arianna Yuan, Fei Wu, Jiwei Li


摘要:在撰写本文时,冠状病毒疾病(COVID-19)的持续大流行已对社会,经济和人们的日常生活造成了严重影响。人们不断在社交媒体上表达对流行病各个方面的意见,使用户生成的内容成为理解公众情绪和关注的重要来源。在本文中,我们基于2020年1月20日至2020年5月11日之间的Twitter和微博帖子,对美国人和中国人的情感轨迹进行了全面分析。具体而言,通过识别人们的情感,情绪(例如愤怒,厌恶,恐惧,幸福,悲伤,惊奇)和情感触发因素(例如,用户生气/悲伤的事物),我们能够描绘出COVID-19时期公众影响的动态。通过对比中国和美国这两个截然不同的国家,我们揭示了人们在不同文化中对COVID-19的看法存在明显差异。我们的研究提供了一种计算方法,可以实时揭示公众对大流行的情绪和担忧,这可能有助于决策者更好地了解人们的需求,从而制定出最佳政策。



测试可以放松社会隔离措施吗?

纽约市COVID-19的未来发展


原文标题:

Can Testing Ease Social Distancing Measures? Future Evolution of COVID-19 in NYC

地址:

http://arxiv.org/abs/2005.14700

作者:

Omar El Housni, Mika Sumida, Paat Rusmevichientong, Huseyin Topaloglu, Serhan Ziya


摘要:“暂停状态下的纽约州”行政命令已于3月22日生效,其目的是确保有足够的社会距离来缓解COVID-19的传播。暂停将以某种形式在纽约市生效,直到六月初。我们使用分区模型来研究测试能力和社会隔离措施对纽约市“暂停后”时期流感大流行演变的影响。我们发现,如果要在停顿后的近期内抵消社会疏远措施中相对较小的放松,测试能力就必须显著提高。特别是,如果纽约市每天进行20,000次测试,并放宽对暂停前标准的社会疏离措施,那么到9月底死亡总数将达到25万。通过将社会疏离措施保持在暂停前和暂停时规范之间的某个位置,并且每天进行10万次测试,到9月底为止的死亡总数可以保持在27,000左右。如果要抑制过多的死亡,必须迅速回到暂停前的社会疏散准则,同时要具备很高的测试能力。如果纽约市在暂停后立即恢复“暂停前”的社会疏散规范,并在9月底之前将死亡总数保持在35,000左右,那么它应该每天进行500,000项测试。我们的发现对纽约市放宽重新开放经济的社会隔离措施所需的测试能力的规模具有重要意义。



包含检疫效应的新型SEIR类型模型

及其在2020年3月至4月波兰

Covid-19大流行病分析中的应用


原文标题:

A new SEIR type model including quarantine effects and its application to analysis of Covid-19 pandemia in Poland in March-April 2020

地址:

http://arxiv.org/abs/2005.14532

作者:

Tomasz Piasecki, Piotr B. Mucha, Magdalena Rosińska


摘要:接触者追踪和隔离是行之有效的非药物流行病控制工具。本文旨在阐明这些措施对COVID-19流行病的影响。引入了新的确定性模型(SEIRQ:易感,暴露,传染,去除,隔离),Q格捕获个体并延迟释放它们。我们获得了一个简单的规则,该规则根据隔离参数,诊断病例的比例和传播参数来定义复制数量 mathcal R 。该模型已应用于2020年3月至2020年4月波兰的流行病,当时采取了社会隔离措施。我们调查了三种情况,分别对应不同比例的诊断病例。我们的结果表明,根据方案的不同,联系跟踪可以阻止50%至90%以上的案例。隔离的影响受到未确诊病例的限制。考虑到引入社会限制之前波兰的传播强度,如果不采取任何社会隔离措施,就不可能实现对这一流行病的控制。



武汉、多伦多和意大利新兴

COVID-19流行病的数据驱动网络模型


原文标题:

A Data-Driven Network Model for the Emerging COVID-19 Epidemics in Wuhan, Toronto and Italy

地址:

http://arxiv.org/abs/2005.14533

作者:

Ling Xue, Shuanglin Jing, Joel C. Miller, Wei Sun, Huafeng Li, Jose Guillermo Estrada-Franco, James M Hyman, Huaiping Zhu


摘要:正在进行的2019年冠状病毒病(COVID-19)大流行威胁着人类健康并造成巨大的经济损失。预测模型和预测流行趋势对于制定缓解这种流行病的对策至关重要。我们开发了一个网络模型,其中每个节点代表一个人,边代表可以传播感染的人与人之间的接触。根据每天与他们接触的次数(节点的度数)和感染状态对个体进行分类。使用马尔可夫链蒙特卡洛(MCMC)优化算法,将传输网络模型分别拟合到武汉(中国),多伦多(加拿大)和意大利共和国的COVID-19流行病的报告数据。我们的模型以狭窄的置信区间很好地拟合了所有三个区域,并且可以适用于模拟其他特大城市或区域。关于遏制战略作用的模型预测可以帮助告知公共卫生当局计划控制措施。



通过人工智能提高社区

的弹性和应急响应能力


原文标题:

Improving Community Resiliency and Emergency Response With Artificial Intelligence

地址:

http://arxiv.org/abs/2005.14212

作者:

Ben Ortiz, Laura Kahn, Marc Bosch, Philip Bogden, Viveca Pavon-Harr, Onur Savas, Ian McCulloh


摘要:包含最新信息技术的新的危机应对和管理方法在应急准备和响应的所有阶段(包括计划,响应,恢复和评估阶段)都至关重要。准确及时的信息与响应组织之间的快速一致的协调一样重要。我们正在努力开发一种多管齐下的应急工具,以使利益相关者及时获得全面,相关和可靠的信息。紧急人员能够更快地分析,传播关键信息并根据关键信息采取行动,他们的响应越有效,越及时,对受灾人群的利益就越大。我们的工具包括对多层开源地理空间数据进行编码,包括洪水风险定位,道路网络强度,主体内陆洪水的淹没地图以及用于估计洪水泛滥地区和受损基础设施的计算机视觉语义分段。这些数据层被组合并用作机器学习算法的输入数据,例如在紧急情况之前,之中和之后找到最佳疏散路线,或首先为受影响地区的第一响应者提供可用住宿清单。即使我们的系统可以用于许多人被迫从一个地点转移到另一个地点的用例中,我们也证明了我们的系统用于北卡罗来纳州卢姆顿飓风佛罗伦萨用例的可行性。



注意力:为了更好地站在巨人的肩膀上


原文标题:

Attention: to Better Stand on the Shoulders of Giants

地址:

http://arxiv.org/abs/2005.14256

作者:

Sha Yuan, Zhou Shao, Yu Zhang, Xingxing Wei, Tong Xiao, Yifan Wang, Jie Tang


摘要:科学科学(SciSci)是一门新兴学科,其中科学用于使用大数据集研究科学本身的结构和演化。有关学术成果的数字数据的可用性不断提高,为探索SciSci提供了前所未有的机会。在科学的进步中,先前发现的知识主要是在激发新的科学观念,而引文是对科学研究这种累积性的合理反映。选择具有潜在影响力的参考文献的研究将领先于新兴出版物。尽管同行评审过程是预测论文未来影响的主要可靠方法,但是在大数据时代的科学影响分析中,基于引用记录预见持久影响的能力越来越重要。本文为长期科学影响力预测开发了一种关注机制,并基于真实的大规模引用数据集对该方法进行了验证。结果打破了常规思维。与其准确地模拟原始的幂律分布,不如强调有限的注意力可以更好地站在巨人的肩膀上。



亲密伴侣监视中使用的工具和策略:

在线不忠论坛的分析


原文标题:

The Tools and Tactics Used in Intimate Partner Surveillance: An Analysis of Online Infidelity Forums

地址:

http://arxiv.org/abs/2005.14341

作者:

Emily Tseng, Rosanna Bellini, Nora McDonald, Matan Danos, Rachel Greenstadt, Damon McCoy, Nicola Dell, Thomas Ristenpart


摘要:滥用者越来越多地使用间谍软件应用程序,帐户入侵和社会工程来监视其亲密伴侣,从而造成严重伤害,并最终导致暴力行为。由于目标与攻击者之间的关系中存在物理访问和信任,因此这种形式的侵犯隐私行为(称为亲密伙伴监视(IPS))是一个极具挑战性的问题,需要解决。尽管先前的研究从幸存者的角度检查了IPS,但我们提出了在线论坛的第一个衡量研究,其中(潜在)攻击者讨论了IPS策略和技术。在诸如网络犯罪,虐待儿童和人口贩运等领域,研究犯罪者的在线行为可以带来更好的威胁情报和打击攻击的技术。我们旨在在IPS方面提供类似的见解。我们确定了五个在线论坛,其中包含有关监视手机以及监视亲密伴侣的其他方式的讨论,其中包括三个在调查不忠行为的情况下。我们对这些论坛进行混合方法分析,以揭示攻击者用来执行监视的工具和策略。通过对论坛内容的定性分析,我们提出了攻击者使用和推荐的IPS策略的分类法,并为寻求遏制IPS传播的技术人员总结了教训。



期刊级引文网络中的无监督异常检测


原文标题:

Unsupervised Anomaly Detection in Journal-Level Citation Networks

地址:

http://arxiv.org/abs/2005.14343

作者:

Baani Leen Kaur Jolly, Lavina Jain, Debajyoti Bera, Tanmoy Chakraborty


摘要:期刊影响因子是一种用于确定学术界期刊质量的流行指标。期刊收到的引文数量是确定影响因子的关键因素,可能以多种方式滥用该影响因子。因此,检测引文异常对于进一步识别影响因子的操纵和膨胀至关重要。引用网络根据有向图对期刊之间的引用关系进行建模。在引证网络中检测异常是一项具有挑战性的任务,在发现引证卡特尔和引文堆栈以及了解引文的意图方面有多种应用。在本文中,我们提出了一种新颖的方法来检测期刊级科学引文网络中的异常,并将结果与现有的图异常检测算法进行比较。由于缺乏适当的事实依据,我们引入了一个期刊级别的引文异常数据集,该数据集由合成注入的引文异常组成,并用它来评估我们的方法。我们的方法能够以100%的精度和86%的F1分数预测异常引用对。我们将检测到的异常进一步分类为各种类型,并找出可能的原因。我们还将在Microsoft学术搜索数据集(一个真实的引文数据集)上分析模型,并使用案例研究来解释我们的结果,其中,结果类似于引文和SCImago Journal Rank(SJR)评级变化图表,从而表明了我们的方法。我们进一步设计了“期刊引文分析工具”,这是一个交互式的门户网站,以引文网络为输入,可以显示期刊级别的异常引文模式,并可以帮助用户多年来分析给定期刊的引文模式。



范围可调节的电流中心性


原文标题:

A Current-Flow Centrality With Adjustable Reach

地址:

http://arxiv.org/abs/2005.14356

作者:

Aleks J. Gurfinkel, Per Arne Rikvold


摘要:量化单个节点的“重要性”的中心性是现代网络理论中最重要的概念之一。最突出的中心性度量可以表示为成对的节点之间的影响流的集合。由于可以使用多种方法来定义影响,因此正在使用许多不同的集中度度量。通过将中心度计算调整为最适合给定网络的状态,参数化中心点可提供更大的灵活性和实用性。在这里,我们确定了中心参数的两类。到达参数控制远距离节点之间影响流的衰减。掌握参数可控制中心性在多个通常是非大地路径上传递影响流的潜力。将这些类别与Borgatti的中心性类型相结合[S. P. Borgatti,《社会网络》第27卷,第55-71页(2005年)],我们得出了用于参数化中心点的新型分类系统。使用这种分类,我们确定明显没有任何径向,达到参数化以及基于非周期性,保守的影响力的集中度度量。因此,我们介绍了地电流中心性,这正是这种类型的度量。由于其在分类法中的独特地位,地流中心性比类似中心具有明显的优势。我们证明,与其他保守流中心点相比,它具有更简单的数学描述。与其他到达中心相比,它在各种网络体系结构中均能可靠地保留直观的排名顺序。我们还表明,它会在节点之间产生一致的中心值分布,既不会平均分散(去本地化),也不会过度关注少数节点(本地化)。其他到达中心分别在常规网络和集线器网络上都表现出这两种行为。



航空运输网络发展中的复发现象


原文标题:

Recurrence in the evolution of air transport networks

地址:

http://arxiv.org/abs/2005.14392

作者:

Kashin Sugishita, Naoki Masuda


摘要:航空运输网络随时间的变化可能是由承运人之间的竞争,航空业法规的变化以及诸如恐怖袭击和流行病等社会经济事件引起的。这种网络变化可能反映每个运营商的公司策略。在本研究中,我们提出了一个框架,用于从递归的角度分析时间离散网络中的演化模式。递归意味着网络结构恢复到与过去相对接近的结构。从1987年到2019年,我们将拟议的方法应用于美国的四家主要运营商。我们发现,这些运营商在网络演进速度,周期性强度以及数十年来这些数量的变化方面都存在差异。我们还发现,各个运营商的网络结构会不时发生突然变化。这种网络变化反映了其在枢纽机场的运营变化,而不是与航空业密切相关的著名社会经济事件。预期所提出的方法可用于揭示例如航空公司联盟的演变以及对自然灾害或传染病的反应,以及表征随着时间推移的社会,生物和其他网络的演变。



考虑公平的链接分析


原文标题:

Fairness-Aware Link Analysis

地址:

http://arxiv.org/abs/2005.14431

作者:

Sotiris Tsioutsiouliklis, Evaggelia Pitoura, Panayiotis Tsaparas, Ilias Kleftakis, Nikos Mamoulis


摘要:在过去的几年中,算法公平性引起了极大的关注。令人惊讶的是,关于网络公平性的工作很少。在这项工作中,我们考虑链接分析算法的公平性,尤其是著名的PageRank算法的公平性。我们提供了公平的定义,并提出了两种实现公平的方法。第一个修改Pagerank算法的跳转向量以增强公平性,第二个对每个节点施加公平行为。我们还考虑了相对于原始算法在使效用损失最小化的同时实现公平的问题。我们用实图和合成图展示了实验,这些图检查了Pagerank的公平性,并定性和定量地证明了我们算法的特性。



捷克电网中的电力线和变压器

对地磁风暴的即时和延迟响应


原文标题:

Immediate and delayed responses of power lines and transformers in the Czech electric power grid to geomagnetic storms

地址:

http://arxiv.org/abs/2005.14448

作者:

Michal Švanda (1 and 2), Didier Mourenas (3), Karla Žertová (4), Tatiana Výbošťoková (5) ((1) Astronomical Institute, Academy of Sciences of the Czech Republic, Ondrejov, Czech Republic (2) Astronomical Institute, Charles University, Prague, Czech Republic, (3) CEA DAM DIF, France (4) Gymnázium Jiřího Ortena, Kutná Hora, Czech Republic (5) Department of Surface and Plasma Science, Charles University, Prague, Czech Republic)


摘要:太阳活动的爆发事件通常会触发地磁场的突然变化。通过感应电流,人类基础设施也受到影响,即电力传输网络的设备。过去的研究表明,暴露于强地磁感应电流后,电网异常率可能会增加。我们寻求捷克配电网中的设备对高地磁活动受到干扰的日子的快速响应。这种受干扰的日子可以通过累积风暴时间 Dst 或 d(   SYM-H)/ dt 低纬度指数来描述,该指数主要受环流变化影响,而累积AE 高纬度测量与亚暴有关的极光电流变化的指数,或通过同时测量环空和极光电流变化的累积中纬度指数。我们使用叠加历元分析来确定在受干扰的日子期间和之后异常率的可能增加。我们显示,在电力线上出现大量异常的情况下,地磁暴发生后立即(在1天之内)异常率显著增加。对于变压器,异常率的增加通常会延迟2—3天。我们还发现,变压器和某些变电站似乎对长时间暴露于亚暴中非常敏感,并且异常现象延迟了。总体而言,我们表明,在地磁活动开始后的5天时间内,捷克电网中记录的异常增加了约5—10%,因此,这一异常部分可能与暴露于地磁活动有关。GIC。



多层网络中的轨迹聚类:

确定帕金森子类型


原文标题:

Trajectory Clustering in Multi-layer Networks: Identifying Parkinson’s Subtypes

地址:

http://arxiv.org/abs/2005.14472

作者:

Sanjukta Krishnagopal


摘要:许多疾病在临床特征及其发展过程中表现出异质性,表明存在疾病亚型。提取亚型疾病可变进程的模式在医学中具有广泛的应用,例如在早期预后和个性化药物治疗中。这项工作提出了一种新颖的,基于数据的,基于网络的轨迹聚类(TC)算法,用于基于疾病轨迹识别帕金森氏症的亚型。TC将患者可变的相互作用建模为双向网络,首先提取了在不同进展阶段共表达疾病变量的群落。然后,它通过对多层以网络中疾病变量的严重性为特征的相似患者轨迹进行聚类,从而确定帕金森氏症的亚型。轨迹相似性的确定考虑了轨迹之间的直接重叠以及二阶相似性,即与第三组轨迹的共同重叠。这项工作将轨迹分为两种类型:(a)时间性,和(b)独立的结果变量范围(代表疾病的严重程度),两者都产生四种不同的亚型。前者亚型在疾病领域进展上存在差异(认知,心理健康等),而后者亚型则表现出不同程度的进展,即有些保持轻度,而另一些则在5年后表现出明显的恶化。TC方法通过统计分析和已鉴定亚型与医学文献的一致性得到验证。这种通用且强大的方法可以轻松地扩展到其他进行性多变量疾病数据集,并且可以有效地协助个性化医学领域的针对性亚型特异性治疗。



图数据库中的多维事件数据


原文标题:

Multi-Dimensional Event Data in Graph Databases

地址:

http://arxiv.org/abs/2005.14552

作者:

Stefan Esser, Dirk Fahland


摘要:过程事件数据通常存储在顺序过程事件日志中或关系数据库中。尽管事件日志的顺序,一维性质有助于基于时间关系(例如“直接/最终跟随”)查询事件的(子)序列,但它不支持查询多个相关实体的多维事件数据。关系数据库允许存储多维事件数据,但是现有的查询语言不支持根据时间关系查询事件的序列或路径。在本文中,我们提出了一个基于标记属性图的多维事件数据通用数据模型,该模型允许系统地将结构和时间关系存储在单个基于图的集成数据结构中。我们为数据模型的所有概念提供语义,并为在多个实体之间进行事件数据建模的通用查询,这些实体进行同步和异步交互。这些查询可将大型现实事件数据集有效地转换为我们的数据模型,并且我们提供了5个转换后的数据集以供进一步研究。我们表明,在现有查询语言Cypher中可以有效地制定和执行用于检索和汇总此类多维事件数据的典型和高级查询,从而引发了一些新的研究问题。具体来说,我们数据模型上的聚合查询可使用现成的技术对多个相互关联的实体进行流程挖掘。



社会系统中基于网络的排名:

三个挑战


原文标题

Network-based ranking in social systems: three challenges

地址:

http://arxiv.org/abs/2005.14564

作者:

Manuel S. Mariani, Linyuan Lü


摘要:排名算法在我们日益数字化的社会中无处不在,在现实世界中具有重要的应用程序,包括推荐系统,搜索引擎和影响者营销实践。从网络科学的角度来看,基于网络的排名算法解决了与为复杂系统的稳定性和动态性而确定重要节点有关的基本问题。尽管这些算法得到了无处不在的成功应用,但我们认为,我们对它们的性能及其在实际问题中的应用的理解仍面临三个基本挑战:(2)其效力可能仅限于特定问题;(3)排名驱动的主体商决策可能会导致潜在的恶意反馈机制和不健康的系统性后果。扎根于网络科学和基于主体的建模的方法可以帮助我们理解和克服这些挑战。




是否可以终止流行病的传播?

动态蒙特卡洛方法


原文标题:

Is it possible to suspend the spread of an epidemic infection? The dynamic Monte Carlo approach

地址:

http://arxiv.org/abs/2005.14320

作者:

Gennadiy Burlak


摘要:我们使用动态蒙特卡洛方法(DMC)研究了在不同风险值  beta (控制参数)值处传播的流行病学感染的动力学。在我们的玩具模型中,感染是由于随机移动的个体的接触而传播的。我们表明,回收的行为关键取决于  beta 值。对于亚临界值  beta < beta_ c  sim 0.6 ,被感染病例的数量渐近收敛于零,因此对于中等风险因素,感染可能会随时间消失。我们的仿真表明,随着时间的流逝,这种系统的性质渐近地接近二维渗流系统中的临界转变。我们还分析了扩展系统,其中包括两个附加参数:启用/关闭隔离状态的限制。发现隔离区的早期隔离确实会导致感染的不规则振荡(Lyapunov指数为正)。如果隔离区的下限足够小,则恢复动力学采集器将显示具有几个阻尼峰的特征性非单调形状。还研究了具有免疫力的个体的感染传播动态。



平等和公正的数字货币网络


原文标题:

Egalitarian and Just Digital Currency Networks

地址:

http://arxiv.org/abs/2005.14631

作者:

Gal Shahaf, Ehud Shapiro, Nimrod Talmon


摘要:加密货币是一种具有分散控制权的数字交换媒介,使经营加密货币的社区拥有主权。领先的加密货币使用工作量证明或权益证明来达成共识,因此本质上是富裕的。这种富裕不仅体现在对执行的控制上,而且还体现在新财富的分配上,从而引发了“富人致富”现象。在这里,我们探讨了一种替代性数字货币的可能性,这种数字货币在控制中并且仅在创造的财富分配方面是平等的。这样的货币可以以基层和回弹的方式形成和增长。单一货币社区可以通过平均硬币铸造来实现分配正义,其中每个成员在每个时间步步铸造一个硬币。平等铸造的局限性在于稀释任何继承的资产,并使每个成员拥有相同的铸造货币份额,并通过成员的相对生产率进行调整。我们的主要定理表明,一个货币网络(主体商可以是多个货币社区的成员)可以通过联合平均铸造,在整个网络上在全球范围内实现分配正义,其中每个主体商在每个时间步仅在一个社区中铸造一个硬币。拥有货币社区计算主体的人之间可以实现平等和分配正义,只要这些主体是真实的(唯一的和唯一的)即可。我们显示货币网络具有sybil弹性,在某种意义上说sybil仅影响拥有货币的社区。此外,如果货币网络具有真正货币社区的子网,则可以在该子网的所有所有者之间实现分配正义。



节点分类中节点嵌入方法的评估过程


原文标题:

A Process for the Evaluation of Node Embedding Methods in the Context of Node Classification

地址:

http://arxiv.org/abs/2005.14683

作者:

Christoph Martin, Meike Riebeling


摘要:节点嵌入方法找到潜在的低维表示形式,这些表示形式用作机器学习模型中的特征。在过去的几年中,这些方法作为手动特征工程的替代方法已经非常流行。由于作者使用各种方法来评估节点嵌入方法,因此很少能有效,准确地比较现有研究。我们通过开发一种公平,客观地评估节点嵌入程序w.r.t.节点分类。该过程支持研究人员和从业人员以可重复的方式比较新方法和现有方法。我们将此过程应用于四种流行的节点嵌入方法,并进行了有价值的观察。使用适当的超参数组合,即使使用较小尺寸的嵌入也可以实现良好的性能,这对于下游机器学习任务和嵌入算法的运行时间是有利的。多个超参数组合产生相似的性能。因此,在大多数情况下,不需要大量的,费时的搜索即可获得合理的性能。



单隶属度系统的3级张量表示


原文标题:

A rank-3 network representation for single-affiliation systems

地址:

http://arxiv.org/abs/2005.14692

作者:

Alexander O. Hultin, James A. Gopsill, Nigel Johnston, Linda B. Newnes


摘要:在自然界和整个社会都观察到单一联盟系统。例子包括协作,组织隶属关系和贸易团体。通常通过网络分析来研究这种系统。多层网络通过增加维度来扩展网络分析的表示,以包含更多信息。因此,他们能够更准确地表示他们正在建模的系统。但是,多层网络通常由4级邻接张量表示,从而产生N2M2解决方案空间。单会员制系统无法占据该空间的全部范围,从而导致数据稀疏,而在这些数据难以通过后续分析获得统计置信度的情况下。为了克服这些限制,本文提出了单隶属度系统的3级张量表示。这些表示能够在无方向网络中维护单联盟网络的完整信息,在有向网络中维护接近全信息,减少其所驻留的解决方案空间(N2M),从而产生具有统计意义的发现,并能够维护多层方法的分析能力。通过比较在两个数据集上进行的rank-3和rank-4表示,可以看出这一点:巴斯大学系期刊共同作者2000-2017和具有随机单一隶属关系的Erdos-Renyi网络。结果表明,网络的结构通过两种表示形式得以维护,而rank-3表示形式则在基于节点的度量中提供了更大的统计置信度,并且可以轻松显示联盟之间和联盟内部的动态。


来源:网络科学研究速递
编辑:王建萍

声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。



近期网络科学论文速递


鲁棒图神经网络的图结构学习 | 网络科学论文速递40篇

居家令对SARS-CoV-2传播影响的因果估计 | 网络科学论文速递24篇

为什么大多数COVID-19感染曲线呈线性?| 网络科学论文速递37篇

COVID-19流行病的城市标度律 | 网络科学论文速递28篇

SARS-CoV-2传播动力学中的随机性和异质性 |  网络科学论文速递16篇

加入集智,一起复杂!






集智俱乐部QQ群|877391004

商务合作及投稿转载|swarma@swarma.org

◆ ◆ 

搜索公众号:集智俱乐部


加入“没有围墙的研究所”

让苹果砸得更猛烈些吧!