集智

心速递

  • 肿瘤连接组:绘制肿瘤内复杂交互网络;

  • 衡量国家在大科学多学科性方面的能力:核聚变研究案例;

  • 最后通牒博弈的反应-达尔文模型:论高扩散时的适度优势;

  • GCN-GAN:加权动态网络的非线性时间链路预测模型;

  • 异质混合种群中的动态免疫博弈;

  • 使用今天的Twitter讨论预测明天的头条;

  • 移民的网络模型:飞地形成与文化整合;

  • 众包视频系统中的用户捐赠;

  • 引爆点动态:通用公式;

  • 大型经济会稳定吗?;

  • 社区检测的EXIT分析;

  • 通过自然语言处理进行假新闻检测很容易受到对抗攻击;

  • 基于复杂网络中模糊局部维的影响力节点识别;

  • 简要综述:受推荐系统启发的响应检索;

  • 测量图属性的稳健性;

  • 图的深度生成模型:使用监督子集选择创建不同的逼真图,及其在电网综合中的应用;

  • 学习二模网络的节点表示;

  • 无线用户移动性预测精度的函数高斯分布模型;

  • 网络的内在尺度很小;

  • 网络镜头:拓扑异构网络中的节点分类;

  • 网页和社会网络动态中的异常检测;

  • EvalNE:评估用于链路预测的网络嵌入的框架;

  • 使用谷歌趋势预测死亡率;

  • 大型同质二元乘法属性图模型中的节点隔离;

  • 优化的变形拉普拉斯算子用于稀疏异构图中基于谱的社区检测;

  • 一种新的基于合成语料库的主题建模算法评估框架;

  • 地域系统的空间和复杂性;

肿瘤连接组:绘制

肿瘤内复杂交互网络

原文标题:

Tumor Connectomics: Mapping the intra-tumoral complex interaction network

地址:

http://arxiv.org/abs/1901.09861

作者:

Vishwa S. Parekh, Michael A. Jacobs

摘要:肿瘤极其异质并且包含许多肿瘤内微环境或亚区域。这些肿瘤微环境可能基于复杂的高层关系与eac相互作用,这可以提供对肿瘤网络组织结构的重要见解。为此,我们开发了肿瘤连接组学框架(TCF)来理解和模拟肿瘤内复杂的功能和形态相互作用。然后,我们证明了TCF在预测接受新辅助化疗的乳腺癌患者的治疗反应方面的潜力。 TCF是在34名乳腺癌患者队列中实施的,这些患者采用动态对比增强(DCE)磁共振成像(MRI)进行新辅助化疗。使用来自DCE-MRI的高级图论中心性,路径长度和聚类度量来建模治疗前后的肿瘤内网络连接(肿瘤连接组)。

计算两个时间点(基线和第一周期)之间的图表度量的百分比变化以预测患者对治疗的最终响应。 TCF可视化跨多个时间点的体素间网络连接,并能够通过治疗评估肿瘤连接组的特定变化。学位中心性被确定为治疗反应的最重要预测因子,AUC为0.83,用于对来自非应答者的应答者进行分类。总之,TCF图表指标为预测乳腺癌治疗反应提供了极好的生物标志物,改善了肿瘤局部和全局变化的可视化和可解释性。

衡量国家在大科学多学科

方面的能力:核聚变研究案例

原文标题:

Measuring national capability over big sciences multidisciplinarity: A case study of nuclear fusion research

地址:

http://arxiv.org/abs/1901.09099

作者:

Hyunuk Kim, Inho Hong, Woo-Sung Jung

摘要: 在大科学时代,各国将大量的研发预算分配给大型科研设施,以提高协作和研究能力。被称为“托卡马克”的核聚变装置是许多国家非常感兴趣的一个来源,因为它理想地产生可持续的能源,有望在未来解决能源危机。在这里,为了探索托卡马克的科学效果,我们绘制了一个国家在核聚变研究中的研究能力,通过动态主题模型检测到五个主题集群 – 材料,等离子,设备,诊断和模拟的规范化显示比较优势。

我们的方法不仅包括中国,印度和大韩民国的增长,还包括加拿大,日本,瑞典和荷兰的衰落。它们起伏的时间点与托卡马克的运作有关,突出了大型科学设施的重要性。引力模型指出,如果两个国家在不同主题中具有相对优势,那么它们在设备,诊断和等离子体研究方面的合作就会减少。与其他科学领域相比,这种关系是核聚变的独特特征。在制定国家大科学政策时,我们可以使用和扩展我们的结果。

最后通牒博弈的反应-达尔文

模型:论高扩展时的适度优势

原文标题:

A Reactive-Darwianian Model for the Ultimatum Game: On the Dominance of Moderation in High Diffusion

地址:

http://arxiv.org/abs/1901.09157

作者:

Roberto da Silva, Pablo Valverde, Luis C. Lamb

摘要: 我们考虑最后通牒博弈的一个版本,它同时将反应和达尔文的方面与文献中的提议结合起来。在反应方面,考虑到之前的结果,我们会考虑引导玩家改变其报价的效果。另一方面,达尔文的方面对应于当当前玩家与他们的一个邻居比较时根据最佳博弈支付来复制更好的策略。因此,我们考虑三种不同的策略,这些策略决定了球员如何改变他们的提议:贪婪,温和和保守。

首先,我们提供了一个静态版博弈的分析研究,其中不考虑达尔文的方面。然后,通过在二维点阵上使用详细和完整的多智能体系统的数值模拟,我们添加了一个额外的特征,其中玩家概率地从极端提供(接近0或1)那些明显的原因。作为提议者,参与者也被赋予互惠作用,这反映在他们作为响应者的收益上。我们还分析了玩家移动效果的影响。分析了策略共存的出现和主导策略的变化,而这又取决于玩家的移动速度。

GCN-GAN:加权动态网络

的非线性时间链路预测模型

原文标题:

GCN-GAN: A Non-linear Temporal Link Prediction Model for Weighted Dynamic Networks

地址:

http://arxiv.org/abs/1901.09165

作者:

Kai Lei, Meng Qin, Bo Bai, Gong Zhang, Min Yang

摘要: 在本文中,我们通常将各种网络系统的动态预测问题(例如,移动性,业务和拓扑的预测)制定为时间链路预测任务。与忽略动态网络中潜在的非线性特征和信息链路权重的传统时间链路预测技术不同,我们引入了一种新的非线性模型GCN-GAN来解决加权动态网络的挑战性时间链路预测任务。所提出的模型利用了图卷积网络(GCN),长短期记忆(LSTM)以及生成对抗网络(GAN)的优势。因此,可以充分利用加权动态网络的动态,拓扑结构和演化模式来改善时间链路预测性能。

具体而言,我们首先利用GCN来探索每个单个快照的本地拓扑特征,然后使用LSTM来表征动态网络的演变特征。此外,GAN用于增强模型生成下一个加权网络快照的能力,可以有效地解决现实生活动态网络中边权重的稀疏性和宽值范围问题。为了验证模型的有效性,我们对不同网络系统和应用场景的四个数据集进行了大量实验。实验结果表明,与最先进的竞争对手相比,我们的模型取得了令人瞩目的成果。

异质混合种群中的动态免疫博弈

原文标题:

Dynamic Vaccination Game in a Heterogeneous Mixing Population

地址:

http://arxiv.org/abs/1901.09285

作者:

Liqun Lu, Yanfeng Ouyang

摘要: 长期以来,反对接种疫苗一直是一种不可忽视的公共卫生现象,这是由于人们对疫苗接种的不同看法(例如,疫苗恐惧症)。本文研究了流行病爆发期间异质人群的自愿接种行为,其中每个人都做出自己的疫苗接种决定,以尽量减少疫苗恐惧症和感染风险的预期延迟性。这样的问题被称为疫苗接种博弈,因为人们的疫苗接种决定不仅通过概率性疾病传播影响他们自己的疾病,而且影响所有其他疾病。

为了研究疫苗接种博弈,将易感染感染移除的疾病传播过程推广到新的流行动力学模型中,以允许在异质混合群体中动态接种疫苗和免疫激活。提出了一种有效的计算方法来评估动态流行系统的最终状态。然后,在这些结果的基础上建立经典的博弈 – 理论均衡模型,以检验人们的疫苗接种行为对流行病爆发的整体风险的影响。假设案例研究用于验证动力学模型和衍生结果,并进行广泛的数值实验以确定影响人们疫苗接种决策和爆发风险的关键因素。此外,还研究了三种替代疫苗接种方案,分别检查早期和非差异疫苗接种处理的效果。

使用今天的Twitter

讨论预测明天的头条

原文标题:

Predicting Tomorrow’s Headline using Today’s Twitter Deliberations

地址:

http://arxiv.org/abs/1901.09334

作者:

Roshni Chakraborty, Abhijeet Kharat, Apalak Khatua, Sourav Kumar Dandapat, Joydeep Chandra

摘要: 预测新闻文章的受欢迎程度是一项具有挑战性的任务。现有文献主要关注文章内容和极性来预测人气。但是,现有的研究并未考虑用户对特定文章的偏好。了解用户的偏好是预测新闻文章流行度的重要方面。因此,我们考虑来自Twitter平台的社交媒体数据来解决这一研究差距。在我们提出的模型中,我们考虑了用户的参与以及用户对文章的反应,以预测文章的受欢迎程度。简而言之,我们通过探讨今天的Twitter讨论来预测明天的标题。我们已经考虑了纽约邮报的300篇政治新闻文章,我们提出的方法优于其他基线模型。

移民的网络模型:

飞地形成与文化整合

原文标题:

A network model of immigration: Enclave formation vs. cultural integration

地址:

http://arxiv.org/abs/1901.09396

作者:

Yao-Li Chuang, Tom Chou, Maria R. D’Orsogna

摘要: 成功地将新移民融入当地社区已成为决策者的一个关键问题,因为越来越多的移民给接收国带来了文化多样性,新技能,有时还带来了社会紧张局势。我们开发了一个基于主体的网络模型来研究相互作用的“主人”和“客人”,并确定合作/整合或不合作/隔离社会出现的条件。假设玩家通过改变网络联系的博弈理论规则以及通过观点动态进行文化接受来寻求社会经济繁荣。

我们发现,在给定的初始条件下,积分的主要预测因素是与文化调整相关的时间尺度,相对于社交链接重塑,对于客人和主人而言。快速的文化调整导致合作和建立长期持续的主客关系。相反,快速的社会联系重塑导致不可逆转地形成孤立的飞地,因为移民和当地人通过群体内联系优化其社会经济收益。我们讨论了移民人口规模如何以及通过政府激励措施或通过招收具有高度理想技能的移民来增加主客体互动的社会经济回报,可能会影响整体移民体验。

众包视频系统中的用户捐赠

原文标题:

User Donations in a Crowdsourced Video System

地址:

http://arxiv.org/abs/1901.09498

作者:

Adele Lu Jia, Xiaoxue Shen, Siqi Shen, Jun Xu

摘要: 像YouTube和Twitch.tv这样众包的视频系统已经成为一种主要的互联网现象,现在已经吸引了超过10亿用户。除了视频共享和观看之外,多年来他们还开发了新功能以促进社区参与,有些设法吸引用户捐赠,社区以及其他用户。用户捐赠直接反映并影响用户在社区中的参与度,并对此类系统的成功产生重大影响。尽管如此,大多数公司的众包视频系统中的用户捐赠仍然是商业机密,迄今为止尚未开发。在这项工作中,我们试图填补这一空白,我们在一个名为BiliBili的众包视频系统中获取并提供有关用户捐赠的公开数据集。根据近4万捐赠者的信息,我们检查用户捐赠的动态及其社会关系,我们定量揭示可能影响用户捐赠的因素,并采用机器学习分类器和网络表示学习模型来及时准确地预测大多数目的地和个人捐款。

引爆点动态:通用公式

原文标题:

Tipping point dynamics: a universal formula

地址:

http://arxiv.org/abs/1901.09622

作者:

Serge Galam, Taksu Cheon

摘要: 突如其来的突如其来的破坏性现象,如现在的法国“gilets jaunes”运动,阿拉伯之泉,特朗普和英国脱欧的胜利,使他们最终预测的可行性受到威胁。在这里,我们声称这种不可预测的社会事件确实是可预测的,前提是可以建立意见景观以确定潜在的动态。我们推导出一个普遍的数学公式,用于异质人口中意见分布的时间演变。它允许识别触发意见流的各种临界点和吸引子,从而揭示突然动荡背后隐藏的机制,如少数民族传播和多数崩溃。

使用我们的公式,如果对相关吸引子进行了适当的识别,则可以在参数评估中具有很大的灵活性来预测意见动态的最终结果。这为大量实际应用开辟了道路,包括投票结果,市场份额和社会趋势。这种定位为预测意见动态结果提供了新的基础,并设想了竞争策略以赢得公众辩论。

大型经济会稳定吗?

原文标题:

Will a Large Economy Be Stable?

地址:

http://arxiv.org/abs/1901.09629

作者:

José Moran, Jean-Philippe Bouchaud

摘要: 我们研究具有Leontief生产函数的公司网络。依靠随机矩阵理论的结果,我们认为当这些网络的规模增加时,或者当生产力/连通性的异质性变得太强时,这些网络通常会变得不稳定。在边际稳定性和大的异质性中,我们发现企业规模的分布在经验观察中形成了幂律尾。危机可以通过小的特殊冲击来触发,这会导致违约的“雪崩”,其特征在于总输出损失的幂律分布。我们推测,演化和行为力量合谋使经济接近边际稳定。这种情况自然可以解释众所周知的“小冲击,大型商业周期”难题,正如Bak,Chen,Scheinkman和Woodford早就预料到的那样。

社区检测的EXIT分析

原文标题:

EXIT Analysis for Community Detection

地址:

http://arxiv.org/abs/1901.09656

作者:

Hussein Saad, Aria Nosratinia

摘要: 本文采用外部信息传递(EXIT)方法,这是一种从错误控制代码的迭代解码分析中引入的技术,研究在存在辅助信息的情况下信念传播在社区检测中的表现。我们既考虑单个(隐藏)社区的检测,也考虑识别两个对称社区的问题。对于单个群落检测,本文证明了EXIT适用于预测弱恢复的渐近相变。更重要的是,利用EXIT分析来产生有用的见解,例如在阈值附近的置信传播的性能。对于两个对称社区,在有限字母边信息下计算置信传播的渐近残差,用嘈杂的标签推广先前的结果。 EXIT分析用于阐明辅助信息对社区检测的影响,其相对重要性取决于图信息与节点标签的相关性,以及辅助信息对残留错误的影响。

通过自然语言处理进行假新

闻检测很容易受到对抗攻击

原文标题:

Fake News Detection via NLP is Vulnerable to Adversarial Attacks

地址:

http://arxiv.org/abs/1901.09657

作者:

Zhixuan Zhou, Huankang Guan, Meghana Moorthy Bhat, Justin Hsu

摘要: 新闻在塑造人们的信仰和观点方面发挥着重要作用。假新闻一直是一个问题,直到美国第45任总统的过去选举周期才公开。虽然自2015年以来已经提出了很多针对假新闻的检测方法,但他们主要关注文章的语言方面而没有任何事实检查。在本文中,我们认为这些模型有可能错误地分类事实篡改假新闻以及未充分写入的真实新闻。通过对最先进的假新闻检测器Fakebox的实验,我们证明事实篡改攻击可能是有效的。为了解决这些弱点,我们认为应该结合语言特征分析采用事实检查,以便真实地将假新闻与真实新闻分开。众包知识图被提议作为收集关于新闻事件的及时事实的稻草人解决方案。

基于复杂网络中模糊

局部的影响力节点识别

原文标题:

Identifying influential nodes based on fuzzy local dimension in complex networks

地址:

http://arxiv.org/abs/1901.09658

作者:

Tao Wen, Wen Jiang

摘要: 如何识别复杂网络中有影响的节点是复杂网络研究的一个重要方面。本文提出了一种新的模糊局部维(FLD)对复杂网络中的影响节点进行排序,其中具有高模糊局部维的节点具有较高的影响能力。该方法通过模糊集关注中心节点距离对中心节点局部维数的影响,导致影响能力发生变化。为了表明该方法的有效性和准确性,本文采用了四个真实网络。同时,易感染(SI)用于通过FLD和其他中心度量来模拟扩散过程,并且Kendall的tau系数用于描述由中心性获得的有影响的节点与由SI模型测量的结果之间的相关性。从排序列表和模拟结果中观察,该方法对有影响的节点进行排序是有效和准确的。

简要综述:受推荐

系统启发的响应检索

原文标题:

Simple Surveys: Response Retrieval Inspired by Recommendation Systems

地址:

http://arxiv.org/abs/1901.09659

作者:

Nandana Sengupta, Nati Srebro, James Evans

摘要: 在过去十年中,简单评级和比较调查的使用在社交和数字媒体平台上激增,以推动建议。这些简单的调查及其与机器学习算法的推断,可以揭示用户对大型和不断增长的项目(如电影,歌曲和广告)的偏好。社会科学家在测量观念,偏好和观点方面有着悠久的历史,通常是在较小的,离散的项目集上进行详尽的评级或排名调查。本文介绍了社会科学应用的简单调查。我们使用四种类型的简单调查进行实验来比较个体和总体比较评估的预测准确性:成对比较和2,5和三个不同背景下的连续点评分:谷歌街景图像的感知安全性,艺术品的可喜性,和动物GIF的欢闹。

在整个背景下,我们发现持续的评分最能预测个人评估,但却消耗最多的时间和认知努力。二元期权调查快速且最有效地预测汇总评估,对集体决策任务有用,但很难预测个性化偏好,Netflix目前使用这些偏好来推荐电影。相比之下,成对比较在预测个人评估方面表现良好,但尽管被广泛用于众包思想和集体偏好,但总体评估预测不佳。我们展示了这些调查的结果如何在低维空间中可视化,揭示了在每种情境中提出的问题的不同答案解释。最后,我们通过反思稀疏,不完整的简单调查与传统调查对应物之间在效率,信息引发和设置方面的差异,其中对更多信息的了解可能对社会科学至关重要。

测量图属性的稳健性

原文标题:

Measuring the Robustness of Graph Properties

地址:

http://arxiv.org/abs/1901.09661

作者:

Yali Wan, Marina Meila

摘要: 在本文中,我们提出了一个扰动框架来衡量图属性的鲁棒性。尽管已经提出了解决该问题的扰动方法,但它们受到扰动强度无法很好控制的限制。我们首先通过在节点上引入权重来提供图上的扰动框架,其中可以通过权重的方差容易地控制扰动的幅度。同时,还保留了图的拓扑结构,以避免扰动中不可控制的强度。然后,我们将鲁棒统计文献中的鲁棒性度量扩展到图属性。

图的深度生成模型:使用

监督子集选择创建不同的

真图,及其在电网综合中的应用

原文标题:

A Deep Generative Model for Graphs: Supervised Subset Selection to Create Diverse Realistic Graphs with Applications to Power Networks Synthesis

地址:

http://arxiv.org/abs/1901.09674

作者:

Mahdi Khodayar, Jianhui Wang, Zhaoyu Wang

摘要: 创建和建模真实图是工程,生物学和社会科学的各种应用中的关键问题;然而,学习节点/边的分布以及从它们采样以生成逼真的图仍然具有挑战性。此外,没有解决所有模仿真实网络的各种合成图的生成。在本文中,解决了创建各种合成图的新问题。首先,我们设计了深度监督子集选择(DeepS3)算法;给定一组基础事实数据点,DeepS3选择最能代表地面实况集中项目的所有项目(即数据点)的不同子集。此外,我们提出深度图表示循环网络(GRRN)作为一种新的生成模型,学习实际加权图的概率表示。

在训练GRRN时,我们生成了一大组合成图,这些图可能遵循与原始图相同的特征和邻接模式。将GRRN与DeepS3结合起来,我们选择了生成图的不同子集,它们最能代表真实图的行为(即我们的地面实况)。我们将模型应用于电网综合的新问题,其中创建的合成电网具有与真实电力系统相同的物理/几何特性,而不会泄露变电站(节点)和线路(边)的实际位置,因为这些数据是保密的。合成电网数据集的实验显示了精确的合成网络,其遵循与真实电网类似的结构和空间属性。

学习二模网络的节点表示

原文标题:

Learning Vertex Representations for Bipartite Networks

地址:

http://arxiv.org/abs/1901.09676

作者:

Ming Gao, Xiangnan He, Leihui Chen, Aoying Zhou

摘要: 近年来,人们对网络表示学习(NRL)的兴趣日益增加。到目前为止,大多数研究工作都集中在同质网络的NRL,例如顶点属于同一类型的社会网络,或者知识图等异构网络,其中顶点(和/或边)是不同类型的。关于二分网络的NRL研究相对较少。可以说,通过网络嵌入方法(如node2vec和LINE)也可以应用于通过忽略顶点类型信息来学习二分网络的顶点嵌入。然而,这些方法在这样做时是次优的,因为现实世界的二分网络涉及两种类型的实体之间的关系,这两种类型的实体通常表现出与其他类型的网络数据不同的属性和模式。例如,电子商务推荐系统需要捕获客户和产品之间的协同过滤模式,搜索引擎需要考虑查询和网页之间的匹配信号。

这项工作解决了二分网络学习顶点表示的研究空白。我们提出了一个新的解决方案BiNE,它是Bipartite Network Embedding的缩写,它解释了二分网络的两个特殊属性:顶点度数的长尾分布和相同类型顶点之间的隐式连接关系。从技术上讲,我们做了三个贡献:(1)我们设计了一个有偏差的随机游走生成器来生成顶点序列,保留顶点的长尾分布; (2)我们通过同时建模显式关系(即观察到的链接)和隐式关系(即未观察到的但是可传递的链接)来提出一种新的优化框架; (3)我们探索了BiNE的理论基础,阐明它的工作原理,证明BiNE可以解释为分解多个矩阵。

无线用户移动性预测

的函数高斯分布模型

原文标题:

Functional Gaussian Distribution Modelling of Mobility Prediction Accuracy for Wireless Users

地址:

http://arxiv.org/abs/1901.09679

作者:

Lu Liu, Wuyang Zhou, Sihai Zhang, Wei Cai

摘要: 提出了迁移率熵来衡量人类运动的可预测性,在此基础上推导出预测精度的上下界,但预测精度的相应数学表达式仍然保持开放。在这项工作中,我们尝试基于大规模CDR数据集的2阶马尔可夫链模型经验结果,在熵方面分析和模拟预测准确性,这证明了具有相同熵水平的用户达到不同水平的观察准确性 cite {Empirical}。

在将熵分成间隔后,我们拟合每个熵区间中高斯分布的准确度的概率密度分布,然后我们估计这些分布的相应均值和标准差。在观察到参数随熵增加而变化后,我们使用最小二乘法对参数与熵之间的关系进行建模。平均值可以建模为线性函数,而标准偏差可以建模为高斯分布。因此,基于上述分析,给定熵的精度的概率密度函数可以用函数高斯分布表示。我们工作的见解是对相关性预测准确性和可预测性熵进行建模的第一步,从而阐明了这方面的进一步工作。

网络的内在尺度很小

原文标题:

The Intrinsic Scale of Networks is Small

地址:

http://arxiv.org/abs/1901.09680

作者:

Malik Magdon-Ismail, Kshiteesh Hegde

摘要: 我们定义网络开始显示其身份的内在规模,作为网络中子图(由随机游走创建)与网络扰动副本中类似大小的子图的区别。我们对几个网络的内在规模进行了广泛的研究,从结构化(例如道路网络)到ad-hoc和非结构化(例如众包信息网络)到生物学。我们发现:(a)内在尺度非常小(7-20个顶点),即使网络的数量级要大许多个数量级。 (b)内在量表量化网络中的“结构” – 为特定任务明确构建的网络具有较小的内在规模。 (c)不同规模的结构可能是脆弱的(易于破坏)或强大的。

网络镜头:拓扑异

网络中的节点分类

原文标题:

Network Lens: Node Classification in Topologically Heterogeneous Networks

地址:

http://arxiv.org/abs/1901.09681

作者:

Kshiteesh Hegde, Malik Magdon-Ismail

摘要: 我们研究了识别大型异构网络的不同部分中发生的不同行为的问题。我们使用不同大小的镜头放大网络,以捕捉网络的本地结构。然后对这些网络签名进行加权,以便为每个节点提供一组预测标签。我们在两个网络上实现了 sim42 %(随机= 11 %)的峰值准确度,每个网络都有 sim100,000 和 sim1,000,000 节点。此外,即使给定节点连接到多达5种不同类型的网络,我们也比随机性能更好。最后,我们对同构网络进行了这种分析,并表明高度结构化的网络具有高度的同质性。

网页和社会网络

动态中的异常检测

原文标题:

Anomaly detection in the dynamics of web and social networks

地址:

http://arxiv.org/abs/1901.09688

作者:

Volodymyr Miz, Benjamin Ricaud, Kirell Benzi, Pierre Vandergheynst

摘要: 在这项工作中,我们提出了一种新的,快速且可扩展的方法,用于在大型时间演化图中进行异常检测。它可以是具有动态节点属性(例如时间序列)的静态图,或者是时间上演变的图,例如时间网络。我们将异常定义为节点集群中时间活动的局部增加。该算法无人监督。尽管来自多个干扰源的噪声,它仍能够检测和跟踪动态网络中的异常活动。我们使用Hopfield网络内存模型来组合图和时间信息。

我们表明,使用内存网络可以很好地发现异常现象。所提出的方法是可扩展的,并且我们提供算法的分布式实现。为了证明其效率,我们将其应用于两个数据集:安然电子邮件数据集和维基百科页面视图。我们表明异常尖峰是由影响网络动态的现实事件触发的。此外,聚类的结构和与检测到的事件相关的时间演变的分析揭示了关于人类如何交互,交换和搜索信息的有趣事实,为大型动态数据集上的集体和社会行为打开了新的定量研究的大门。

EvalNE:评估用于链路

预测的网络嵌入的框架

原文标题:

EvalNE: A Framework for Evaluating Network Embeddings on Link Prediction

地址:

http://arxiv.org/abs/1901.09691

作者:

Alexandru Mara, Jefrey Lijffijt, Tijl De Bie

摘要: 在本文中,我们介绍了EvalNE,一个用于评估链路预测任务的网络嵌入方法的Python工具箱。链路预测是评估网络嵌入质量的最常用选择之一。但是,这项任务的复杂性需要精心设计的评估渠道,以便提供一致,可重复和可比较的结果。 EvalNE通过提供任务的自动化和抽象来简化此过程,例如超参数调整和模型验证,边采样和负边采样,来自节点嵌入的边嵌入计算以及评估指标。工具箱允许评估任何现成的嵌入方法,而无需编写额外的代码。此外,它还可以用于评估任何其他链路预测方法,并集成若干链路预测启发式作为基线。

使用谷歌趋势预测死亡率

原文标题:

Forecasting mortality using Google trend

地址:

http://arxiv.org/abs/1901.09692

作者:

Fu-Chun Yeh

摘要: 美国拥有世界上最大的经济体,因此可以作为调查发达国家运动模式的理想代表。对死亡原因进行早期监测至关重要,这可以帮助制定预防登革热等重大疾病的预防措施。研究报告称,一些搜索查询,尤其是谷歌趋势中与疾病相关的术语是必不可少的。为此,我们将谷歌趋势的主要死因或扩展或更一般的术语包含在使用维纳级联模型解码死亡率相关术语中。使用搜索项的时间序列和小波尺度图,搜索查询的模式被分类为不同的周期级别。

结果包括(1)解码趋势,(2)特征重要性,以及(3)解码模式的准确性。关于预测因子的三种情景包括使用(1)所有19个特征,(2)前十个最周期预测因子,或(3)具有最高权重的十个预测因子。所有搜索查询范围均为2013年12月至2018年12月。结果显示,具有较高权重和年度周期模式的搜索项对预测单词die有较大贡献;然而,只有体重较高的预测因子才能预测死亡这个词。

大型同质二元乘法

图模型中的节点隔离

原文标题:

Node isolation in large homogeneous binary multiplicative attribute graph models

地址:

http://arxiv.org/abs/1901.09698

作者:

Sikai Qu, Armand M. Makowski

摘要: 乘法属性图(MAG)模型由Kim和Leskovec引入,作为某些类别的现实世界网络的数学易处理模型。它是隐藏图模型的一个实例,并实现了网络结构由与节点单独关联的属性共同形成的合理概念。这些作者研究了该模型的几个方面,包括其连通性,巨大组件的存在,直径和度分布。当节点的数量和节点属性的数量都无限大时,这在渐近机制中完成,后者在自然可容许条件下与前者成比例。

在相同的设置中,我们探索了孤立节点的存在(或等效地,缺失),这是原始论文中未讨论的属性。本文的主要结果是没有孤立节点的{ em#zero-one}定律;这个零一法则与Kim和Leskovec在图连通性方面获得的一致(尽管在略微较弱的假设下)。我们通过以非标准方式将第一和第二矩的方法应用于与孤立节点的数量相关联的多组计数随机变量来证明这些结果。

优化的变形拉普拉斯算子用于

疏异构图中基于谱的社区检测

原文标题:

Optimized Deformed Laplacian for Spectrum-based Community Detection in Sparse Heterogeneous Graphs

地址:

http://arxiv.org/abs/1901.09715

作者:

Lorenzo Dall’Amico, Romain Couillet, Nicolas Tremblay

摘要: 谱聚类是用于图上的社区检测的最流行但仍未完全理解的方法之一。在本文中,我们研究了基于变形拉普拉斯矩阵 D-rA 的谱稀疏,用于稀疏异构图(遵循两级度校正随机块模型)。对于特定值 r = zeta ,我们表明,与Bethe Hessian或非回溯算子方法等竞争方法不同,聚类对图异质性不敏感。基于启发式参数,我们研究了 D- zeta A 的信息特征向量的行为,因此,我们准确地预测了聚类的准确性。通过对实际网络的广泛模拟和应用,得到的聚类算法经过验证和观察,系统地优于最先进的竞争方法。

一种新的基于合成语料库

的主题建模算法评估框架

原文标题:

A new evaluation framework for topic modeling algorithms based on synthetic corpora

地址:

http://arxiv.org/abs/1901.09848

作者:

Hanyu Shi, Martin Gerlach, Isabel Diersen, Doug Downey, Luis A. N. Amaral

摘要: 主题模型广泛用于自然语言处理及其他领域。在这里,我们提出了一个新的框架,用于评估基于合成语料库的概率主题建模算法,该合成语料库包含明确定义的地面真实主题结构。我们方法的主要创新是通过比较令牌级别的指定主题标签来量化种植和推断主题结构之间的一致性。在实验中,我们的方法产生了关于主题模型的相对强度的新颖见解,因为语料库特征变化,并且当种植结构薄弱时,主题模型的第一个证据是“不可检测的阶段”。我们还通过预测主题建模算法在真实世界语料库中的分类任务中的性能,确定了对合成语料库获得的见解的实际相关性。

地域系统的空间和复杂性

原文标题:

Space and complexities of territorial systems

地址:

http://arxiv.org/abs/1901.09869

作者:

Juste Raimbault

摘要: 地域系统的空间特征在其复杂性的出现中起着至关重要的作用。该贡献旨在说明在这种系统的模型中可以在何种程度上展示不同类型的复杂性。我们从理论的角度发展了一些论证,说明了本体论复杂性,在可能的表征的多样性和多维度的意义上,然后是出现意义上的复杂性,即存在几个自治层次的必要性。然后,我们提出数值实验来探索两个简单的城市形态发生模型中的复杂性(动态复杂性和共同演化)的性质。我们最后提出了复杂性的其他方面,这可能是地域系统的典型特征。

来源:网络科学研究速递

编辑:孟婕

声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。

近期网络科学论文速递

多主体通信博弈中的涌现语言现象 等7篇

基于置信度的图卷积网络半监督学习 等8篇

金融病毒在欧洲及其他地区的蔓延 等18篇

共享出行可以服务多少乘客?等11篇

最大的线上文本、情感、社交关系数据集 等16篇

选择随机网络中的重要节点的有效采样 等11篇

加入集智,一起复杂!


集智

集智俱乐部QQ群|877391004

商务合作及投稿转载|swarma@swarma.org

搜索公众号:集智俱乐部

加入“没有围墙的研究所”

集智

让苹果砸得更猛烈些吧!

原文始发于微信公众号(集智俱乐部):集智