集智

心速递

  • 图注意力自动编码器;

  • forgeNet:使用基于树的集合分类器进行特征提取的图深度神经网络模型;

  • 基于超网络的用户创新知识集成模型;

  • 多方面隐私:如何在不暴露敏感属性的情况下表达您的在线角色;

  • 扩展的无标度网络;

  • 复杂网络中的信息对等;

  • 监控动态网络:基于模拟的策略,用于比较监控方法和比较研究;

  • 复杂网络中点对点传输的形态组织;

  • 预测巴西法院的判决;

  • 基于模块化的注意力模型的无监督社区检测;

  • Tempus Volat,Hora Fugit——离散和连续时间动态网络模型综述;

  • 通过微观网络模型和宏观分支过程描述的扩散动态可能因聚结而不同;

  • 从零开始学习识别高介数中心性节点:一种新的图神经网络方法;

  • 使用boutique进行社交媒体数据的多模型调查探索——以公共卫生为例;

  • 检测网络中时间序列数据的路径异常;

  • 单个向量够了吗?探索网络嵌入的节点多义性;

  • 用闭合系数测量有向三元闭包;

  • 具有M个选择的离散意见动态;

  • 优化种子扩展群落检测的广义PageRank方法;

  • FOBE和HOBE:一阶和高阶二分嵌入;

  • 共享感受:了解Facebook对学术文章的反应;

  • MCNE:学习社会网络的多个条件网络表示的端到端框架;

  • 无监督欧氏距离攻击网络嵌入;

  • 代码存储库中的幂律:可疑的方法;

  • hα 指数是否强化了科学中的马太效应?使用Stata和R的基于主体的模拟;

  • 决策参考信息;

  • 在社会网络中传播八卦的信任模型;

  • 探索解的景观结构可以实现更可靠的网络社区检测;

  • 健康和阿尔茨海默氏症大脑的网络属性;

  • 扩展大规模图的细粒度模块化聚类;

  • 计数网络上大型时间序列数据的因果路径;

图注意力自动编码器

原文标题:

Graph Attention Auto-Encoders

地址:

http://arxiv.org/abs/1905.10715

作者:

Amin Salehi, Hasan Davulcu

摘要: 自动编码器已成为无监督学习的成功框架。然而,传统的自动编码器不能在结构化数据中使用显式关系。为了利用图结构数据中的关系,最近提出了几种图自动编码器,但它们忽略了重建图结构或节点属性。在本文中,我们提出了图注意自动编码器(GATE),一种用于图结构数据的无监督表示学习的神经网络架构。我们的架构能够通过配备自注意机制的堆叠编码器/解码器层重建图结构输入,包括节点属性和图结构。

在编码器中,通过将节点属性视为初始节点表示,每个层通过参与其邻居的表示来生成节点的新表示。在解码器中,我们尝试反转编码过程以重建节点属性。此外,节点表示被规则化以重建图结构。我们提出的架构不需要预先了解图结构,因此可以应用于归纳学习。我们的实验证明了在转换和归纳任务的几个节点分类基准数据集上的竞争性能,甚至超过了大多数情况下监督学习基线的性能。

forgeNet:使用基于树

的集合分类器进行特征

提取的图深度神经网络模型

原文标题:

forgeNet: A graph deep neural network model using tree-based ensemble classifiers for feature extraction

地址:

http://arxiv.org/abs/1905.09889

作者:

Yunchuan Kong, Tianwei Yu

摘要: 对于组学数据的预测模型构建的一个独特挑战是样本(n)与大量特征(p)相比较少。这种 “n≪p” 属性使用深度学习技术为疾病结果分类带来了困难。通过结合外部基因网络信息(例如图嵌入式深度前馈网络(GEDFN)模型)进行稀疏学习已成为该问题的解决方案。但是,此类方法需要现有的特征图,并且特征图的潜在错误指定可能对分类和特征选择有害。

为了解决这一局限并开发一个不依赖外部知识的稳健分类模型,我们提出了一个 forest graph embedded deep feedforward network (forgeNet) ,将 GEDFN 架构与森林特征图提取器集成,以便可以以监督的方式学习特征图,并专门为给定的预测任务构建。为了验证方法的能力,我们使用合成和真实数据集对 forgeNet 模型进行了实验。由此产生的高分类精度表明该方法是对组学数据的稀疏深度学习模型的有价值的补充。

基于超网络的用

户创新知识集成模型

原文标题:

An Integrated Model for User Innovation Knowledge Based on Super-network

地址:

http://arxiv.org/abs/1905.09923

作者:

Xiao Liao, Zhihong Li, Yunjiang Xi, Haibo Wang, Kenneth Zantow

摘要: 在线用户创新社区正在成为用户创新知识和创意用户的有前途的来源。为了识别有价值的创新知识和用户,本研究构建了一个集成的超级网络模型,即用户创新知识超级网络(UIKSN),将零散的知识,知识领域,用户和帖子整合到在线社区知识系统中。基于 UIKSN,核心创新知识,核心创新知识领域,核心创新用户以及个人用户的知识结构都可以确定。这些研究结果有助于捕捉产品,流行创新和创意用户的创新趋势,并为挖掘做出贡献,并在社区创新理论中整合和分析创新知识。

多方面隐私:如何在不暴露敏感

属性的情况下表达您的在线角色

原文标题:

Multifaceted Privacy: How to Express Your Online Persona without Revealing Your Sensitive Attributes

地址:

http://arxiv.org/abs/1905.09945

作者:

Victor Zakhary, Ishani Gupta, Rey Tang, Amr El Abbadi

摘要: 社会网络流分析中的最近工作表明,可以从用户写入或参与的主题中准确地推断出用户的在线角色属性(例如,性别,种族,政治兴趣,位置等)。属性和偏好推断已广泛用于提供个性化推荐,有向广告以及增强社会网络中的用户体验。但是,泄露用户的敏感属性可能会对某些人构成隐私威胁。微观定位(例如,Cambridge Analytica丑闻),监视和辨别广告是由敏感属性推断引起的对用户隐私的威胁的示例。

在本文中,我们提出了 Multifaceted privacy ,这是一种新颖的隐私模型,旨在模糊用户的敏感属性,同时公开保留用户的公共角色。为了实现多方面的隐私,我们构建了 Aegis ,这是一个以客户为中心的原型社会网络流处理系统,有助于保护多方面的隐私,从而允许社会网络用户自由表达他们的在线角色,而不会泄露他们敏感的选择属性。

Aegis允许社会网络用户控制哪些角色属性应该公开显示以及哪些属性应该保密。为此,Aegis不断向社会网络用户建议主题和主题标签,以便对其敏感属性进行模糊处理,从而混淆基于内容的敏感属性推断。仔细选择建议的主题以保留用户公开显示的角色属性,同时隐藏其私有敏感角色属性。我们的实验表明,添加少至0到4个混淆帖子(取决于显示原始帖子的方式)会成功隐藏用户指定的敏感属性,而不会更改用户的公共角色属性。

扩展的无标度网络

原文标题:

Extended Scale-Free Networks

地址:

http://arxiv.org/abs/1905.10267

作者:

Arthur Charpentier, Emmanuel Flachaire

摘要: 最近,Alderson 等人。 (2009)提到(严格)无标度网络在现实生活中很少见。这可能与 Stumpf,Wiuf&May(2005)的声明有关,即无标度网络的子网络不是无标度的。在后来,这些子网络渐近无标度,但不应忘记二阶偏差(实际上也可能是三阶偏差)。

在本文中,我们介绍了扩展的无标度网络的概念,受扩展的 Pareto 分布的启发,实际上描述真实网络可能比严格的自由属性更真实。该属性与 Stumpf,Wiuf&May(2005)一致:无标度大型网络的子网络不是严格无标度的,而是扩展无标度。

复杂网络中的信息对等

原文标题:

Information parity in complex networks

地址:

http://arxiv.org/abs/1905.10281

作者:

Aline Viol, Philipp Hövel

摘要: 对复杂网络理论越来越感兴趣,导致对新分析工具的持续需求。我们提出了一种基于信息论的新方法,为更好地理解网络系统提供了新的视角:称为“信息奇偶校验”,它量化了节点之间关于整个网络架构的影响协调。考虑到测地距离的统计,信息奇偶校验检测一对节点可以如何影响并受网络影响。这允许我们量化节点收集的信息的质量。

为了证明该方法的潜力,我们评估了社会网络和人脑网络。我们的研究结果表明,社会网络中节点的意识形态取向等新兴现象受到其信息平台的严重影响。我们还表明,解剖学大脑网络在位于矢状平面附近的半球间对应区域具有更大的信息对等。最后,与整个网络相比,功能网络平均具有更大的半球间通信区域的信息平价。我们发现具有高信息奇偶性的一对区域表现出更高的相关性,这表明皮质区域之间的功能相关性可以部分地由它们对整个大脑的整体影响的对称性来解释。

监控动态网络:一个

于模拟的研究策略,用

于比较监控方法和比较研究

原文标题:

Monitoring dynamic networks: a simulation-based strategy for comparing monitoring methods and a comparative study

地址:

http://arxiv.org/abs/1905.10302

作者:

Lisha Yu, Inez M. Zwetsloot, Nathaniel T. Stevens, James D. Wilson, Kwok Leung Tsui

摘要: 最近,人们对监测和识别动态网络的变化产生了很大的兴趣,这导致了各种监测方法的发展。不幸的是,没有系统地比较这些方法;此外,新方法通常是针对特定用例而设计的。鉴于此,我们建议使用仿真来比较网络监控方法在各种动态网络变化中的性能。

使用我们的模拟动态网络系列,我们比较了文献中几种最先进的社会网络监控方法的性能。 我们将他们的表现与各种类型的变化进行比较;我们考虑通信水平的提高,节点倾向的变化以及社区结构的变化。我们表明,不存在一种统一优于其他方法的方法;最好的方法取决于上下文和希望检测的更改类型。因此,我们得出结论,网络监控需要多种方法,并且了解给定方法适合的场景非常重要。

复杂网络中点对点传输的形态组织

原文标题:

Morphological organization of point-to-point transport in complex networks

地址:

http://arxiv.org/abs/1905.10333

作者:

Min-Yeong Kang, Geoffroy Berthelot, Liubov Tupikina, Christos Nicolaides, Jean-Francois Colonna, Bernard Sapoval, Denis S. Grebenkov

摘要: 我们研究了复杂无标度网络中点对点电力,扩散或液压传输的结构组织。应用电位差的两个节点(源极和漏极)的随机选择选择两个树状结构,一个从源出现,另一个会聚到漏极。这些树合并成剩余节点的大群,这些节点被发现是准等势的,因此几乎不存在对运输的阻力。这种全局“树簇 – 树”结构是通用的,并导致电流分布的幂律衰减。其指数 -2 由树的连续分支点处的电流的乘法减少确定,并且发现其与网络连通度和电阻分布无关。

预测巴西法院的判决

原文标题:

Predicting Brazilian court decisions

地址:

http://arxiv.org/abs/1905.10348

作者:

André Lage-Freitas, Héctor Allende-Cid, Orivaldo Santana, Lívia de Oliveira-Lage

摘要: 预测法院判决是有用的,但对于律师和其他法律专业人员来说仍然是一项极其困难的任务。搜索案例信息以提取有价值的信息并不容易,因为这需要处理大量数据集及其复杂性。例如,巴西法律制度的复杂性以及高诉讼率使得这个问题更加困难。本文介绍了一种预测巴西法院判决的方法,该方法也能够预测该决定是否一致。我们开发了一个工作原型,对来自巴西法院的4,043个案件组成的数据集执行79%的准确度(F1分数)。据我们所知,这是第一项预测巴西法官判决的研究。

基于模块化的注意

力模型的无监督社区检测

原文标题:

Unsupervised Community Detection with Modularity-Based Attention Model

地址:

http://arxiv.org/abs/1905.10350

作者:

Ivan Lobov, Sergey Ivanov

摘要: 在本文中,我们讨论了无监督节点聚类在图上的问题,并展示了注意模型的最新进展如何能够成功地应用于问题的“坚固”状态。我们提出了一种无监督算法,通过优化软模块性损失对 Bethe Hessian 嵌入进行编码,并认为我们的模型对于经典和图神经网络(GNN) 模型都具有竞争力,同时它可以在单个图上进行训练。

Tempus Volat,Hora Fugit——

离散和连续时间动态网络模型综述

原文标题:

Tempus Volat, Hora Fugit — A Survey of Dynamic Network Models in Discrete and Continuous Time

地址:

http://arxiv.org/abs/1905.10351

作者:

Cornelius Fritz, Michael Lebacher, Göran Kauermann

摘要: 鉴于可用于建模动态网络的工具数量不断增加,合适模型的选择变得至关重要。通常很难比较不同模型的适用性和解释。本次调查的目的是提供流行的动态网络模型的概述。该调查的重点是引入具有相应假设,优势和不足的二元网络模型。根据生成过程划分模型,分别在离散和连续时间操作。

首先,我们介绍时间指数随机图模型(TERGM)及其扩展,可分离 TERGM(STERGM),两者都是时间离散模型。然后将这些模型与连续过程模型进行对比,重点关注关系事件模型(REM)。我们还展示了 REM 如何处理时间聚类观测,即在离散时间点观察到的连续时间数据。除了讨论理论性质和拟合程序外,我们还特别关注使用代表国际武器转让的网络模型的应用。该数据允许证明网络模型的适用性和解释。

通过微观网络模型和宏

观分支过程描述的扩

动态可能因聚结而不同

原文标题:

Description of spreading dynamics by microscopic network models and macroscopic branching processes can differ due to coalescence

地址:

http://arxiv.org/abs/1905.10402

作者:

Johannes Zierenberg, Jens Wilting, Viola Priesemann, Anna Levina

摘要: 通常通过计算随时间的发生次数来在宏观水平上监测扩散过程。然后,假设微观贡献可忽略不计,则可以在微观层面上建模,假设存在潜在的相互作用网络,或者直接在宏观层面上建模。两种描述的宏观特征通常被认为是相同的。在这项工作中,我们表明微观和宏观描述的这些特征可能由于聚结而不同,即,节点被多个源同时激活。

特别地,我们考虑具有退火连接病症的(微观)分支网络(概率元胞自动机),记录宏观活动,然后通过(宏观)分支过程来近似该活性。在此框架中,我们分析计算合并对集体动态的影响。我们证明了聚结导致了连续网络活动的条件期望值的通用非线性尺度函数。这使我们能够量化微观模型参数和已建立的宏观估计之间的差异。为了克服这种差异,我们提出了一种非线性估计器,可以正确地推断出所有系统尺寸的模型分支参数。

从零开始学习识别高介数中心

性节点:一种新的图神经网络方法

原文标题:

Learning to Identify High Betweenness Centrality Nodes from Scratch: A Novel Graph Neural Network Approach

地址:

http://arxiv.org/abs/1905.10418

作者:

Changjun Fan, Li Zeng, Yuhui Ding, Muhao Chen, Yizhou Sun, Zhong Liu

摘要: 中介中心性(BC)是用于网络分析的最常用的中心度量之一,其旨在描述网络中节点在通过它们的最短路径的分数方面的重要性。它是许多有价值的应用程序的关键,包括社区检测和网络拆解。由于高时间复杂性,计算大型网络上的BC分数在计算上具有挑战性。

已经提出了许多近似算法来加速 BC 的估计,其主要是基于采样的。然而,这些方法在大规模网络上仍然倾向于相当长的执行时间,并且当网络结构发生微小变化时,它们的结果通常会加剧。在本文中,我们专注于在图中识别具有高 BC 的节点,因为许多应用场景是在检索具有 top-k BC 的节点的基础上构建的。与以前的启发式方法不同,我们将此任务转化为学习问题,并设计基于编码器 – 解码器的框架来解决问题。

更具体地说,编码器利用网络结构将每个节点编码成嵌入向量,该嵌入向量捕获节点的重要结构信息。解码器将每个节点的嵌入向量变换为标量,其以BC的形式捕获该节点的相对等级。我们使用成对排名损失来训练模型以识别关于其BC的节点的顺序。通过对小规模网络的训练,学习模型能够为任何看不见的网络的节点分配相对BC分数,从而识别高排名的节点。在合成和现实世界网络上的综合实验表明,与代表性基线相比,我们的模型大大加快了预测速度,但没有明显的精度牺牲,并且在几个大型真实世界网络上的准确性超过了最新技术水平。

使用 boutique 进行社

交媒体数据的多模型调查

探索——以公共卫生为例

原文标题:

Multi-Model Investigative Exploration of Social Media Data with boutique: A Case Study in Public Health

地址:

http://arxiv.org/abs/1905.10482

作者:

Junan Guo, Subhasis Dasgupta, Amarnath Gupta

摘要: 我们介绍了公共卫生中数据科学问题的经验,研究人员利用社交媒体(Twitter)确定公众是否表现出对公共卫生运动提供的艾滋病预防措施的认识。为了帮助研究人员,我们开发了一个名为精品的调查探索系统,允许用户通过仪表板界面执行多步骤可视化和数据探索。精品的独特功能包括处理多元商店提供的异类数据的能力,以及将计算作为调查探索过程的一部分的能力。在本文中,我们介绍了精品中间件的设计,并通过调查过程来解决现实问题。

检测网络中时间

序列数据的路径异常

原文标题:

Detecting Path Anomalies in Time Series Data on Networks

地址:

http://arxiv.org/abs/1905.10580

作者:

Timothy LaRock, Vahan Nanumyan, Ingo Scholtes, Giona Casiraghi, Tina Eliassi-Rad, Frank Schweitzer

摘要: 时间序列数据中的无监督检测异常具有重要的应用,例如,在用户行为建模,欺诈检测和网络安全中。异常检测已经在分类序列中进行了广泛研究,但是我们经常可以访问包含通过网络的路径的时间序列数据。示例包括金融网络中的交易序列,交叉引用文档的网络中的用户点击流,或交通网络中的旅行路线。为了可靠地检测异常,我们必须考虑这样的事实,即这些数据包含大量由图拓扑约束的短路径的独立观测。

此外,真实系统的异质性排除了基于频率的异常检测技术,这些技术不考虑高度偏斜的边和度数统计。为了解决这个问题,我们引入了一种新的框架,用于无限制地检测图中大型可变长度时间路径中的异常,这提供了一种有效的分析方法来检测具有异常频率的路径,这些异常频率是由于节点以意想不到的时间顺序遍历而产生的。

单个向量够了吗?探

索网络嵌入的节点多义性

原文标题:

Is a Single Vector Enough? Exploring Node Polysemy for Network Embedding

地址:

http://arxiv.org/abs/1905.10668

作者:

Ninghao Liu, Qiaoyu Tan, Yuening Li, Hongxia Yang, Jingren Zhou, Xia Hu

摘要: 网络已被广泛用作抽象现实世界系统以及组织实体之间关系的数据结构。网络嵌入模型是将网络中的节点映射到连续向量空间表示中的强大工具,以便于后续任务,例如分类和链路预测。现有的网络嵌入模型将每个节点的所有信息(例如链路和属性)全面地集成到单个嵌入向量中,以表示节点在网络中的一般角色。然而,真实世界的实体可以是多方面的,由于不同的动机或不一定相关的自我特征,它连接到不同的社区。

例如,在电影推荐系统中,用户可能同时喜欢喜剧或恐怖电影,但这两种类型的电影在嵌入空间中不太可能相互接近,用户嵌入矢量也不足以接近它们。同一时间。在本文中,我们提出了一种多维嵌入方法,用于对节点的多个方面进行建模,这是由语言建模中的单词多义现象所驱动的。节点的每个方面被映射为嵌入向量,而我们还维持每对节点和方面之间的关联度。所提出的方法适用于各种现有的嵌入模型,而不会使优化过程显著复杂化。我们还讨论了如何将不同方面的嵌入向量用于推理任务,包括分类和链路预测。对真实世界数据集的实验有助于全面评估所提方法的性能。

用闭合系数测量有向三元闭包

原文标题:

Measuring Directed Triadic Closure with Closure Coefficients

地址:

http://arxiv.org/abs/1905.10683

作者:

Hao Yin, Austin R. Benson, Johan Ugander

摘要: 最近研究无向图中聚类的工作引起了对聚焦于三角形“中心”节点的聚类测量与侧重于“启动器”的测量之间的区别的关注,这种区别具有相当大的后果。与此同时,有向图中的现有措施都是以中心为中心的。在这项工作中,我们提出了一系列有向闭包系数,从节点启动闭包的角度来衡量有向图中三元闭合的频率。

我们观察到这些系数在现实世界网络上的显著经验变化,即使在诱导有向三角形是同构的情况下也是如此。为了理解这种现象,我们在有向配置模型下检验了闭包系数的理论行为。我们的分析说明了闭合系数与网络的联合入度和出度分布的时刻之间的潜在联系,提供了对观察到的不对称性的解释。我们使用有向闭包系数作为两个机器学习任务中的预测器。我们在类平衡二元预测中找到 AUC 分数高于0.92的可解释模型,大大优于使用传统中心聚焦测量的模型。

具有M个选择的离散意见动态

原文标题:

Discrete Opinion Dynamics with M choices

地址:

http://arxiv.org/abs/1905.10878

作者:

Andre C. R. Martins

摘要: 在这里,我研究如何获得一个意见动态模型,其中有可能存在 M 离散选择,并且需要对每个代理选择的强度进行建模。获得新模型作为连续意见和离散行动(CODA)模型的扩展。解决了为简单模型选择适当变量的技术难题。对于对称情况,找到无标度模型。但是,在分析结果时,似乎需要改变变量以便于解释。这里也观察到极端主义,这是通过局部加强具有相同选择的代理人域内的意见而产生的。

优化种子扩展群落检

测的广义 PageRank 方法

原文标题:

Optimizing Generalized PageRank Methods for Seed-Expansion Community Detection

地址:

http://arxiv.org/abs/1905.10881

作者:

Pan Li, Eli Chien, Olgica Milenkovic

摘要: 图上的随机游走(RW)的着陆概率(LP)编码关于图拓扑的丰富信息。广义 PageRanks(GPR)表示 RW 的 LP 的加权和,利用 LP 特征的判别能力来实现许多基于图的学习研究。该领域以前的工作主要集中在评估 GPR 的合适重量,目前为止只有少数研究试图得出给定应用的 GRP 的最佳权重。通过使用随机图模型来更好地理解 GPR 的行为,我们在这个方向上迈出了基础性的一步。

在这种情况下,我们提供了一个严格的非渐近分析,用于 LP 和 GPR 的收敛与它们在边无关随机图上的平均场值。虽然我们的理论结果适用于许多问题设置,但我们关注的是随机块模型的种子扩展社区检测任务。在那里,我们发现基于渐近发现, LP 的预测能力显著降低。鉴于此结果,我们提出了一种新的 GPR ,称为逆 PR(IPR),LP 权重在步行的最初几步增加。在合成和实际大规模网络上的广泛实验表明,与其他 GPR 相比,IPR 在种子群落检测方面具有优势。

FOBE 和 HOBE:

一阶和高阶二分嵌入

原文标题:

FOBE and HOBE: First- and High-Order Bipartite Embeddings

地址:

http://arxiv.org/abs/1905.10953

作者:

Justin Sybrandt, Ilya Safro

摘要: 典型的图嵌入可能无法捕获在推荐系统,数据可视化和药物发现等领域中出现的特定于类型的二部图特征。使用专门的嵌入技术可以更好地服务于这些应用中使用的机器学习方法。我们提出了两个嵌入二部图,它将边分解为节点邻域之间的间接关系集。

在对高阶关系进行抽样时,我们通过图上的代数距离来强化相似性。我们还介绍了整体嵌入,将两者结合成“两全其美”的嵌入。所提出的方法在链路预测和推荐任务上进行评估,并与其他最先进的嵌入进行比较。虽然在应用程序中都非常有益,但我们证明所考虑的嵌入都没有明显优越(与许多论文中所声称的相反),并讨论了它们之间存在的权衡。

共享感受:了解

Facebook对学术文章的反应

原文标题:

Shared Feelings: Understanding Facebook Reactions to Scholarly Articles

地址:

http://arxiv.org/abs/1905.10975

作者:

Cole Freeman, Mrinal Kanti Roy, Michele Fattoruso, Hamed Alhoori

摘要: 社交媒体平台的研究倾向于依靠文本分析来执行研究任务。虽然基于文本的方法显著提高了我们对在线行为和社交动态的理解,但他们忽略了过去几年中突出显示的这些平台上的功能:基于点击的内容响应。在本文中,我们提供了一个新的 Facebook 反应数据集学术内容。我们概述了它的结构,分析了数据中的一些统计趋势,并用它来训练和测试两种有监督的学习算法。我们的初步测试表明,页面之后的用户数量存在分层,这些划分似乎与这些页面主题的区别一致。

MCNE:学习社会网络的

多个条件网络表示的端到端框架

原文标题:

MCNE: An End-to-End Framework for Learning Multiple Conditional Network Representations of Social Network

地址:

http://arxiv.org/abs/1905.11013

作者:

Hao Wang, Tong Xu, Qi Liu, Defu Lian, Enhong Chen, Dongfang Du, Han Wu, Wen Su

摘要: 最近,网络表示学习(NRL)技术引起了广泛关注,该技术通过低维向量表示图结构以支持面向社交的应用。虽然已经做了很多努力,但是他们可能无法描述社交用户之间的相似性的多个方面,因为仅针对每个节点表示了用于一个唯一方面的单个向量。为此,在本文中,我们提出了一个新的端到端框架 MCNE 来学习多个条件网络表示,以便可以完全捕获对多个行为的各种偏好。

具体来说,我们首先设计一个二元掩模层,将单个矢量划分为多个行为的条件嵌入。然后,我们引入注意网络来模拟多个偏好之间的交互关系,并进一步利用图神经网络的自适应消息发送和接收操作,从而捕获来自高阶邻居的多方面偏好信息。最后,利用贝叶斯个性化排序损失函数来学习每个行为的偏好相似度,并通过多任务学习框架共同学习多个条件节点嵌入。对公共数据集的大量实验证实,我们的MCNE框架可以明显优于几个基准模型,并进一步支持可视化和转移学习任务,具有出色的可解释性和稳健性。

网络嵌入上的无

监督欧氏距离攻击

原文标题:

Unsupervised Euclidean Distance Attack on Network Embedding

地址:

http://arxiv.org/abs/1905.11015

作者:

Qi Xuan, Jun Zheng, Lihong Chen, Shanqing Yu, Jinyin Chen, Dan Zhang, Qingpeng Zhang Member

摘要: 考虑到网络嵌入方法在图数据挖掘中的广泛应用,受到深度学习中的对抗性攻击的启发,本文提出了一种基于遗传算法(GA)的欧几里德距离攻击策略(EDA)来攻击网络嵌入,以防止某些结构信息被发现。 EDA 专注于通过对网络结构的最小修改尽可能地干扰嵌入空间中的一对节点之间的欧几里德距离。

由于大量下游网络算法(例如社区检测和节点分类)依赖于节点之间的欧几里德距离来评估嵌入空间中它们之间的相似性,因此 EDA 可被视为对各种网络算法的通用攻击。与传统的监督攻击策略不同,EDA 不需要标记信息,据我们所知,是第一种无监督网络嵌入攻击方法。我们将 DeepWalk 作为开发 EDA 的基础嵌入方法。

使用一组真实网络的实验表明,所提出的 EDA 方法可以显著降低基于 DeepWalk 的网络算法的性能,即社区检测和节点分类,优于几种启发式攻击策略。我们还表 明 EDA 也可以很好地攻击基于其他常见网络嵌入方法的网络算法,如高阶邻近保留嵌入(HOPE)和非嵌入式网络算法,如标签传播算法(LPA)和特征向量。矩阵(EM)。结果表明 EDA 方法具有很强的可转移性。

代码存储库中的

幂律:不可知论方法

原文标题:

Power laws in code repositories: A skeptical approach

地址:

http://arxiv.org/abs/1905.11044

作者:

Bartolomé Ortiz, J. J. Merelo-Guervós

摘要: 使用现代方法和源控制管理系统进行的软件开发通常被建立为自组织的一个例子,代码通过不依赖于权力,领导或指令的活动有机地发展和演变。证明这些主张的主要挑战是不能通过直接观察来检测自组织,而是通过对系统的测量来寻找提示,例如某些特征上存在幂律,例如随时间变化的大小。我们打算在本文中解决的问题是建立一种方法,用于检查我们过去已经测量的一组选定的存储库,如果关于幂律的声明实际上是从精确的数学观点来看,那么,在软件工程文献(和其他文献)中普遍显示,幂律比初看起来更难以捉摸。

出于这个原因,在本文中,我们提出了一组统计上准确的测试,这些测试将帮助我们从存储库的变化方式决定它们是否真的由幂律分布,这可能表明我们存在通过自组织而形成的状态,或者实际上,幂律如何准确地符合16个开源存储库的 git 存储库中提交的更改大小的观察分布。我们重新审视这些观察中最具代表性的论文之一,重新评估其结果,并将其与其中分析的存储库的当前状态进行比较,试图阐明电力法可能存在与否的变化。

hα指数是否强化了

科学中的马太效应?使用

Stata和 R 的基于主体的模拟

原文标题:

Does the hα index reinforce the Matthew effect in science? Agent-based simulations using Stata and R

地址:

http://arxiv.org/abs/1905.11052

作者:

Lutz Bornmann, Christian Ganser, Alexander Tekles, Loet Leydesdorff

摘要: 最近,Hirsch(2019a)提出了一个名为 hα 引用指标新变种。他的表述如下:“当科学家是家是 α-author时,我们将科学家的 hα 指数定义为科学家以 h 指标为核心的论文数量(即有助于科学家的h指数的论文集)。”hα 指数受到Leydesdorff,Bornmann和Opthof(2019)的批评。

他们最重要的一点是该指数强化了科学中的马太效应。我们使用最近开发的 Stata 命令(h_index)和 R 包(hindex)来解决当前研究中的这一点,它可用于模拟研究评估中的 h 指数和 hα指数应用程序。用户可以调查 hα 在哪些条件下强化马太效应。我们的研究结果证实了 Leydesdorff 等人的研究结果。 (2019)预期: hα 指数加强了马太效应。如果在模拟中另外考虑出版科学家的战略行为和累积优势效应,则可以加强这种效果。

决策参考信息

原文标题:

Decision-making with reference information

地址:

http://arxiv.org/abs/1905.11200

作者:

Riho Kawaguchi, Daichi Yanagisawa, Katsuhiro Nishinari

摘要: 我们经常通过获取显示周围人偏好指数的支持信息来尝试预测他人的行为。为了重现这些情况,我们提出了一个名为“带参考信息的单侧偏好博弈(OSPG-R)”的博弈。我们进行了实验,其中具有相似偏好的玩家在 OSPG-R 中竞争对象。在实验中,我们使用了三种不同类型的对象:盒子,面孔和汽车。我们的结果表明,最常选择的对象不是最受欢迎的对象。为了更深入地了解实验结果,我们构建了一个基于两个假设的决策模型:

(1)参与者是理性的

(2)确信其他参与者的偏好顺序等同于组内偏好指数。

与模型的选择行为相比,实验结果表明,当对象是面部时,或者特定玩家的优先级较低时玩家存在冒险的倾向。

社会网络中传

播流言的信任模型

原文标题:

A trust model for spreading gossip in social networks

地址:

http://arxiv.org/abs/1905.11204

作者:

Rinni Bhansali, Laura P. Schaposnik

摘要: 我们在这里介绍一种多类型的 bootstrap 渗透模型,我们称之为 T-Bootstrap Percolation(T-BP),并将其应用于研究社会网络中的信息传播。在该模型中,社会网络由图 G 表示,图 G 的顶点具有与人在网络中扮演的角色类型(例如学生,教育者等)相对应的不同标签。

一旦 G 的一组初始顶点被随机选择为携带消息,消息就会传播到新的顶点,只要它通过具有不同标签的最小顶点阈值发送。通过考虑随机图表,它们已被证明可以很好地代表社会网络,我们通过数值模拟研究了 T-BP 模型的不同属性,并描述了它在应用于谣言传播,假新闻和营销策略时的含义。

探索解的景观结构可以

实现更可靠的网络社区检测

原文标题:

Exploring the solution landscape enables more reliable network community detection

地址:

http://arxiv.org/abs/1905.11230

作者:

Joaquín Calatayud, Rubén Bernardo-Madrid, Magnus Neuman, Alexis Rojas, Martin Rosvall

摘要: 为了理解复杂系统的组织和功能,研究人员经常在系统的交互网络中识别社区。由于实际上不可能探索所有解决方案以保证最佳解决方案,因此许多社区检测算法依赖于多个随机搜索。但对于网络和随机算法的给定组合,有多少搜索足以找到足够好的解决方案?标准方法是选择相当大量的搜索并选择具有最高质量的网络分区,或者基于所有网络分区获得一致的解决方案。但是,如果不同的分区具有相似的质量,使得解决方案格局退化,则单个最佳分区可能会遗漏相关信息,并且共识解决方案可能会使互补社区模糊。

在这里,我们通过对解决方案格局的粗粒度描述来解决这种退化问题。我们根据网络分区的相似性对网络分区进行聚类,并提出一种方法来确定充分描述解决方案格局所需的最小搜索次数。为了充分利用所有分区,我们还提出了探索解决方案前景的不同方法,包括重要性聚类过程。我们在合成和真实网络上测试这些方法,并发现不同的网络和算法需要不同数量的搜索,并且探索粗粒度解决方案环境可以揭示值得注意的补充解决方案并实现更可靠的社区检测。

健康和阿尔茨海

默氏症大脑的网络属性

原文标题:

Network properties of healthy and Alzheimer’s brains

地址:

http://arxiv.org/abs/1905.11249

作者:

José C. P. Coninck, Fabiano A. S. Ferrari, Adriane S. Reis, Kelly C. Iarosz, Antonio M. Batista, Ricardo L. Viana

摘要: 小世界结构通常用于描述大脑中的结构连接。在这项工作中,我们将健康大脑的皮层区域和受阿尔茨海默病影响的大脑的结构连接与人工小世界网络进行比较。基于统计分析,我们证明了可以使用 Newman-Watts 程序构建类似的小世界网络。两个结构矩阵的网络量化在概率谷内识别。尽管结构连接矩阵和采样的小世界网络之间存在相似性,但在阿尔茨海默病脑中可以发现增加的相关性。我们的结果表明,网络量化可以帮助识别真实结构连接矩阵中的异常。

扩展大规模图的

细粒度模块化聚类

原文标题:

Scaling Fine-grained Modularity Clustering for Massive Graphs

地址:

http://arxiv.org/abs/1905.11275

作者:

Hiroaki Shiokawa, Toshiyuki Amagasa, Hiroyuki Kitagawa

摘要: 模块化聚类是理解复杂图的重要工具。然而,由于两个严重的缺点,现有方法不适用于大规模图。

(1)由于分辨率极限问题,很难完全再现实际的群集。

(2)它们在计算上是昂贵的,因为必须迭代地计算所有节点和边。

本文提出了 gScarf,它可以在短时间内输出细粒度的簇。为了克服上述缺点, gScarf 动态修剪不必要的节点和边,确保它捕获细粒度的群集。实验表明, gScarf 在查找具有高精度的群集时,在运行时间方面优于现有方法。

计数网络上大型时

间序列数据的因果路径

原文标题:

Counting Causal Paths in Big Times Series Data on Networks

地址:

http://arxiv.org/abs/1905.11287

作者:

Luka V. Petrovic, Ingo Scholtes

摘要: 图或网络表示是关系数据中数据挖掘和机器学习任务的重要基础。许多网络分析工具,如中心性度量,信息排序或集群检测,都依赖于链接捕获直接影响的假设,并且这些路径代表可能的间接影响。该假设在带时间戳的网络数据捕获中无效,例如动态社会网络,生物序列或金融交易。在这样的数据中,对于两个带时间戳的链路(A,B)和(B,C),时间顺序和定时确定是否存在从节点 A 经由 B 到 C 的因果路径。

许多工作表明,由于这个原因,网络分析不能直接应用于带时间戳的网络数据。解决该问题的现有方法需要关于因果路径的统计,这对于大数据集而言在计算上具有挑战性。为解决这个问题,我们开发了一种有效的算法来计算带时间戳的网络数据中的因果路径。

将其应用于经验数据,我们表明我们的方法比在 OpenSource 数据分析包中实现的基线方法更有效。我们的方法可以有效地处理因果路径的连续链路之间的最大时间差的不同值,并支持流式场景。有了它,我们正在缩小阻碍对复杂网络上的大时间序列数据进行有效分析的差距。

来源:网络科学研究速递

编辑:孟婕

声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。

近期网络科学论文速递

什么是社会组织的熵?等8篇

全球不同地区Facebook用户统计特征差异 等18篇

人们会信任什么样的线上社交团体? 等20篇

限制在线社会网络应用程序的隐私泄漏 等11篇

剖析用于图分类的图神经网络 等21篇

加入集智,一起复杂!


集智

集智俱乐部QQ群|877391004

商务合作及投稿转载|swarma@swarma.org

搜索公众号:集智俱乐部

加入“没有围墙的研究所”

集智

让苹果砸得更猛烈些吧!

原文始发于微信公众号(集智俱乐部):集智