-
“待在附近或被检查”:Covid-19锁定退出策略;
-
在锁定后的世界中,基于社会网络的疏远策略可以使COVID 19曲线平坦;
-
框定COVID-19:我们如何在Twitter上概念化和讨论大流行;
-
-
标准化和基准化与危机相关的社交媒体数据集,以进行人道主义信息处理;
-
Twitter用户在48小时内吸收了美国“春季夏令时”的睡眠损失;
-
-
-
在Yahoo!中使用维基百科进行实体推荐的分层图嵌入知识图谱;
-
-
-
-
“待在附近或被检查”:
Covid-19锁定退出策略
“Stay Nearby or Get Checked”: A Covid-19 Lockdown Exit Strategy
http://arxiv.org/abs/2004.06891
Jan-Tino Brethouwer, Arnout van de Rijt, Roy Lindelauf, Robbert Fokkink
摘要:本文重述了网络理论中的经典见解,即长距离连接驱动了疾病传播,将其转化为控制第二波Covid-19的策略。我们模拟了一个场景,在该场景中,首先对总体施加锁定,然后部分解除,同时将远距离传输保持在最低水平。模拟的传播方式类似于Covid-19在各个国家,地区和省份的当代分布,提供了一些模型验证。结果表明,所提出的策略可能会大大减少第二次浪潮。我们还发现,锁定后爆发事件在当地的停留时间更长,有助于地理围堵。公共政策可以通过将重点放在交通和运输上的医学测试和移动性跟踪工作上来重点关注长久的关系。可以按照简单合理的原则将此政策传达给公众:待在附近或受到检查。
在锁定后的世界中,
基于社会网络的疏远策略
可以使COVID 19曲线平坦
原文标题:
Social network-based distancing strategies to flatten the COVID 19 curve in a post-lockdown world
http://arxiv.org/abs/2004.07052
Per Block, Marion Hoffman, Isabel J. Raabe, Jennifer Beam Dowd, Charles Rahal, Ridhi Kashyap, Melinda C. Mills
摘要:COVID-19大流行强调了有效的非药物公共卫生干预措施的重要性。尽管社会隔离和隔离已被广泛采用,但由于完全或接近完全锁定的不利社会、心理和经济后果,更温和的减少接触的政策可能变得可取。通过采用一种新颖的社会网络方法,我们评估了三种有针对性的疏远策略的有效性,这些策略旨在“保持曲线平坦”并在锁定后的世界中帮助遵守法规。我们模拟随机感染曲线,该曲线结合了感染模型,理想型社会网络模型和统计关系事件模型的核心要素。我们的模型表明,虽然社会疏远措施确实使曲线趋于平坦,但战略性地减少接触可以极大地提高其效率,从而引入了在保持较低风险的同时允许进行一些社会接触的可能性。将互动限制在几次重复的接触中成为了最有效的策略。通过三联症策略保持联系之间的相似性和加强社区也非常有效。这种方法提供了经验证据,为有效的社会隔离增加了细微的政策建议,可以减轻社会隔离的不利影响。
框定COVID-19:我们如何
在Twitter上概念化和讨论大流行
原文标题:
Framing COVID-19: How we conceptualize and discuss the pandemic on Twitter
http://arxiv.org/abs/2004.06986
Philipp Wicke, Marianna M. Bolognesi
摘要:这几周的医生和护士忙于与一个新的隐形敌人Covid-19作战。城市被封,居民被困在自己的家中,以防止病毒传播。与战争有关的术语通常用于围绕流行病和疾病进行论述。可以说,围绕当前流行病的论述不仅在公共话语和媒体中,而且在非大众传播专家撰写的推文中,都将利用与战争有关的隐喻。我们在此基于2020年3月至4月在Twitter上发布的20万条推文的语料库,对围绕Covid-19的话题进行了分析。使用主题建模,我们首先分析可以对话题进行分类的主题。然后,我们证明WAR框架用于谈论特定主题,例如病毒治疗,而不是其他主题,例如社会距离对人群的影响。然后,我们测量并比较WAR框架与三个替代图框架(MONSTER,STORM和TSUNAMI)和用作控制组的文字框架(FAMILY)的受欢迎程度。结果表明,尽管FAMILY文字框架覆盖了语料库的较大部分,但在比喻框架中,WAR是最常用的,因此可以说是最传统的框架。但是,我们得出的结论是,该框架不适合围绕当前情况所涉及的许多方面进行论述。因此,我们得出结论,根据先前的建议,过多的取景选项或隐喻菜单可以促进社交媒体上与Covid-19相关的论述中涉及的各个方面的交流,从而支持平民表达他们在当前大流行期间的感受,观点和想法。
原文标题:
SI-spreading-based network embedding in static and temporal networks
http://arxiv.org/abs/2004.06750
Xiu-Xiu Zhan, Ziyu Li, Naoki Masuda, Petter Holme, Huijuan Wang
摘要:链路预测可用于提取丢失的信息,识别虚假交互以及预测网络发展。网络嵌入是一种将坐标分配给低维向量空间中的节点的方法。通过将节点嵌入向量中,可以将链路预测问题转换为相似度比较任务。具有相似嵌入矢量的节点更可能被连接。经典的网络嵌入算法是基于随机游走的。他们通过随机游走对轨迹路径进行采样,并从轨迹路径生成节点对。节点对集还用作Skip-Gram模型的输入,Skip-Gram模型是将节点(被视为单词)嵌入向量中的代表性语言模型。在本研究中,我们建议用传播过程(即易感性感染(SI)模型)代替随机行走过程来采样路径。具体来说,我们提出了两种基于SI扩展的算法SINE和TSINE,分别用于嵌入静态和时间网络。与最新的静态和时间网络嵌入算法相比,缺少链路预测任务可以评估我们算法的性能。结果表明,在所有六个经验数据集中,SINE和TSINE均优于基线。我们进一步发现,SINE的性能通常比TSINE更好,这表明时间信息并不一定会改善缺少链路预测的嵌入。此外,我们研究了量化为轨迹路径总长度的采样大小对嵌入算法性能的影响。与基线算法相比,SINE和TSINE的更好性能需要更小的采样大小。因此,基于SI扩展的嵌入倾向于更适用于大规模网络。
标准化和基准化与危机
相关的社交媒体数据集,
以进行人道主义信息处理
原文标题:
Standardizing and Benchmarking Crisis-related Social Media Datasets for Humanitarian Information Processing
http://arxiv.org/abs/2004.06774
Firoj Alam, Hassan Sajjad, Muhammad Imran, Ferda Ofli
摘要:对社交媒体流进行时间紧迫的分析对于人道主义组织计划灾难期间的快速响应非常重要。危机信息学研究社区已经开发了多种技术和系统,用于在社交媒体上处理和分类大型危机数据。但是,由于文献中使用了各种不同的数据集,因此无法比较结果并无法衡量在建立更好的危机分类模型方面所取得的进展。在这项工作中,我们尝试通过提供与危机相关的标准数据集来弥合这一差距。我们整合了8个带注释的数据源的标签,并提供了166.1k和141.5k条推文,以提供信息和人道主义分类任务。合并还会导致更大的数据集大小,这有助于训练更强大的模型。我们还使用CNN和BERT模型提供基线结果。我们在 https://crisisnlp.qcri.org/crisis_datasets_benchmarks.
Twitter用户在48小时内吸收了
美国“春季夏令时”的睡眠损失
原文标题:
The sleep loss insult of Spring Daylight Savings in the US is absorbed by Twitter users within 48 hours
http://arxiv.org/abs/2004.06790
Kelsey Linnell, Thayer Alshaabi, Thomas McAndrew, Jeanie Lim, Peter Sheridan Dodds, Christopher M. Danforth
摘要:睡眠不足与心脏病,糖尿病,癌症和事故增多有关,所有这些都是美国死亡的主要原因。人口规模的睡眠研究有潜力通过帮助识别高危人群,集体睡眠方式的变化并为政策变化提供信息,从而促进公共卫生。先前的研究表明,可以使用社交媒体活动估算其他类型的健康指标,例如抑郁症和肥胖症。然而,无法利用公开可用数据有效地测量集体睡眠,限制了大规模的学术研究。在这里,我们通过对Twitter活动资料的主体分析来研究睡眠丧失的被动估计。我们使用发生在美国夏令时开始的“春季向前”事件作为自然的实验条件,以估计整个美国睡眠丧失的空间差异。平均而言,Twitter高峰活动发生在春季前进后的周日大约45分钟之后。然而,到星期一早上,活动曲线与前一周重新对齐,这表明至少在Twitter上,周日清晨的损失时间已被迅速吸收。
原文标题:
Probabilistic Model of Narratives Over Topical Trends in Social Media: A Discrete Time Model
http://arxiv.org/abs/2004.06793
Toktam A. Oghaz, Ece C. Mutlu, Jasser Jasser, Niloofar Yousefi, Ivan Garibay
摘要:在线社交媒体平台已成为有关全球性事件的新闻和叙述的主要来源。但是,缺乏一种系统的,基于摘要的叙事提取方法,该方法可以促进主要潜在事件的交流。为了解决这个问题,我们提出了一种新颖的基于事件的叙事摘要提取框架。我们提出的框架被设计为概率主题模型,具有分类时间分布,然后是提取文本摘要。我们的主题模型可以识别时间随时间变化的主题重复性。该框架不仅从数据中捕获主题分布,而且可以估算用户活动随时间的波动。此外,我们定义显著性-分散性权衡(SDT)作为比较措施,以识别带有时间戳的语料库中具有最高终生吸引力的主题。我们根据大量Twitter数据评估我们的模型,其中包括针对叙利亚白盔部队进行的虚假宣传活动中的一百万条以上的推文。我们的结果表明,提出的框架可以有效地识别主题趋势,以及从带有时间戳数据的文本语料库中提取叙事摘要。
原文标题:
Prisoner’s Dilemma on Real Social Networks: Revisited
http://arxiv.org/abs/2004.06817
Sharon M. Cameron, Ariel Cintrón-Arias
摘要:囚徒困境是一种博弈论模型,用于描述在各种人群中看到的利他行为。这种理论上的博弈对于理解为什么一种看似自私的策略为什么会持续存在并散布在随机均匀混合的人群中非常重要。对于具有由社会互动决定的结构的人群,囚徒困境揭示了利他策略得以确立的某些要求。使用模拟社会网络和真实社会网络的数据集对囚徒困境进行了蒙特卡洛模拟。在这两种情况下,我们都确认了利他主义在人口中的持久性要求。
在 Yahoo! 中使用维基百科进行
实体推荐的分层图嵌入知识图谱
原文标题:
Layered Graph Embedding for Entity Recommendation using Wikipedia in the Yahoo! Knowledge Graph
http://arxiv.org/abs/2004.06842
Chien-Chun Ni, Kin Sum Liu, Nicolas Torzec
摘要:在本文中,我们描述了一种用于Wikipedia的基于嵌入的实体推荐框架,该框架将Wikipedia组织成相互重叠的图集合,从其拓扑和内容中学习互补的实体表示形式,并将其与轻量级学习相结合。在Wikipedia上推荐相关实体的等级方法。通过脱机和在线评估,我们证明,所产生的嵌入和推荐在质量和用户参与度方面表现良好。兼顾简单性和质量,此框架为Yahoo!中的英语和其他语言提供了默认的实体建议。知识图,Wikipedia是其核心子集。
原文标题:
Roommate Compatibility Detection Through Machine Learning Techniques
http://arxiv.org/abs/2004.06970
Mansha Lamba, Raunak Goswami, Mr. Vinay, Mohit Lamba
摘要:我们的目标是开发一种人工智能系统,该系统旨在检查共享共同居住区域的同性或异性室友之间的兼容性。有几个关键因素决定一个人与另一个人的兼容性。人际行为,情境意识,沟通技巧。在这里,我们正在尝试构建一个系统,对这些关键因素进行用户评估,而不是通过笔纸测试,而是通过一系列高度吸引人的问题和答案。因此,将这些分数用作我们的机器学习算法的输入,该算法基于先前的趋势得出用户与另一个用户兼容的百分比概率。随着人口的增长,组织和教育机构始终面临着使学生及其雇员变得越来越有生产力的挑战,在这种情况下,一个人的社会环境开始发挥作用。一个人可能是一个天才,但只要他不能与同龄人一起工作,就总是有机会提高工作效率。众所周知,人类一直以来都是社会动物,这有助于建立志趣相投的人的社区。很多时候,即使没有大量的人要从事一项特定的任务,结果也可能不如人们期望的那样,因为人们彼此不兼容。最终,这会导致性能差距,阻碍组织成功以及在许多情况下损失宝贵的资源。我们的目的不是要从图片中删除不兼容的人,而是要找到其他人的完美兼容对象,这不仅可以节省资源,还可以有效利用资源。通过使用各种机器学习分类技术,我们打算做到这一点。
原文标题:
Caching Structures for Distributed Data Management in P2P-based Social Networks
http://arxiv.org/abs/2004.07033
Newton Masinde, Moritz Kanzler, Kalman Graffi
摘要:分布式应用程序需要新颖的解决方案来解决由于带宽,内存和处理能力等资源匮乏而引起的问题。在分布式数据管理中可以看到这些挑战之一。挑战是两部分问题,即确保内容在访问时是有效的,并在更改时立即对其进行更新。当考虑基于p2p的分布式在线社会网络时,这尤其困难,该网络旨在在通常不可靠和不安全的设备上构建可靠,安全的社会网络平台。在本文中,我们针对社交缓存机制提出了三种选择策略,即随机,趋势和社交评分。他们考虑了社会网络中的社交互动模式。我们在基于DHT的分布式在线社会网络LibreSocial中实施和评估它们,并证明社交评分是最佳策略。此外,我们实现了社交缓存解决方案,并且还表明,与现有的缓存解决方案结合使用时,几乎所有请求都可以通过缓存进行处理,同时在更新期间保持数据的一致性。
原文标题:
Provable Overlapping Community Detection in Weighted Graphs
http://arxiv.org/abs/2004.07150
Jimit Majmudar, Stephen Vavasis
摘要:社区检测是一个受到广泛研究的无监督学习问题,其中的任务是基于观察到的成对实体交互将相似实体分组在一起。此问题已在各种领域中应用,例如社会网络分析和计算生物学。在社区不重叠的假设下,有大量文献研究了这个问题。当允许社区重叠时,通常会假设一个纯节点,即每个社区都有一个仅属于该社区的节点。在本文中,我们提供了一种可证明的方法来检测加权图中的重叠社区,而无需明确地假设纯节点。而且,与大多数现有算法相反,我们的方法是基于凸优化的,为此它已经知道了许多有用的理论特性。我们在人工和现实数据集上证明了我们算法的成功。
原文标题:
Minimizing Interference and Selection Bias in Network Experiment Design
http://arxiv.org/abs/2004.07225
Zahra Fatemi, Elena Zheleva
摘要:当前网络中A / B测试的方法集中于限制干扰,这种担忧是治疗效果可能从治疗节点“溢出”到控制节点并导致有偏因果效应估计。网络实验设计的突出方法依赖于两阶段随机化,其中识别出稀疏连接的群集,群集随机化指示将节点分配给处理和控制。在这里,我们表明集群随机化不能确保足够的节点随机化,并且会导致选择偏向,其中处理和控制节点代表不同的用户群。为了解决这个问题,我们为网络实验设计提出了一个有原则的框架,该框架共同最小化了干扰和选择偏差。我们介绍了边溢出概率和群集匹配的概念,并展示了它们在设计网络A / B测试中的重要性。我们在许多实际数据集上的实验表明,我们提出的框架所导致的因果效应估计误差比现有解决方案要低得多。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。
集智俱乐部QQ群|877391004
商务合作及投稿转载|swarma@swarma.org
搜索公众号:集智俱乐部
加入“没有围墙的研究所”
让苹果砸得更猛烈些吧!