新浪微博用户画像:基于计算语言特征的建模 | 网络科学论文速递29篇-集智俱乐部

核心速递

  • 通过社交媒体建模用户肖像;

  • 行动或反应:分析在线社区审核的主动策略;

  • 大规模二部图的对抗表示学习;

  • 基于冗余的分辨率和基于投影的层间耦合的多层网络模块化;

  • 基于弹性的事后建筑检查优先级排序方法;

  • Twitter 上分享的关于 MeToo 运动的在线资源:帕累托原则;

  • 面包屑:具有兴趣点注释的特征丰富的移动数据集;

  • 改善快速公交系统中的公交车流量:基于元胞自动机模拟的方法;

  • 社交媒体用户行为的跨平台建模;

  • 模拟社会网络中的回声室和极化动态;

  • 具有联合表示学习内容和连接的异常检测;

  • 用于广义多任务学习的图星网络;

  • 使用社交媒体数据建模食物受欢迎度依赖性;

  • 自动发现网络生成过程族;

  • 通过边添加实现K核最大化;

  • 关键边识别:基于 K-Truss 的模型;

  • 建模城市;

  • 几何空间中数据簇团或网络社区的角可分性及其与双曲嵌入的关系;

  • 基于主体的创造性领导有效性模拟;

  • 临近性网络的潜在几何和动态;

  • 使用立场分类进行假新闻检测:一项综述;

  • 具有顽固链接的社会网络动态的不稳定性;

  • 使用节点中心性度量子网中的影响;

  • 搜寻对个性化内容图像推荐的影响;

  • 使用图嵌入的无监督对抗图对齐;

  • 利用社会信号改进加密货币价格预测;

  • 基于社交媒体的用户嵌入:文献综述;

  • iPool ——层级图神经网络中基于信息的池化;

  • 网络结构与初始群体规范分布在规范冲突中的作用;

通过社交媒体建模用户肖像

原文标题:

Modeling of User Portrait Through Social Media

地址:

http://arxiv.org/abs/1906.12323

作者:

Haiqian Gu, Jie Wang, Ziwen Wang, Bojin Zhuang, Fei Su

摘要:如今,用户信息和社交行为的大量有用数据已经在互联网上积累,提供了在线描述用户个性特征的可能性。在本文中,我们提出了一种基于计算语言特征的心理建模方法,用于描述新浪微博(中国类似 Twitter 的微博服务)用户的五大人格特质及其与用户社交行为的相关性。

据我们所知,这是第一个在新浪微博上调查个人资料信息,社会网络行为和个性特征之间潜在关系的研究。我们的结果展示了一种有效的建模方法,可以在没有客户中断的情况下理解社交媒体上用户的人口统计和心理肖像,这可以让商业公司提供更好的个性化产品。

行动或反应:分析在

线社区审核的主动策略

原文标题:

To Act or React: Investigating Proactive Strategies For Online Community Moderation

地址:

http://arxiv.org/abs/1906.11932

作者:

Hussam Habib, Maaz Bin Musa, Fareed Zaffar, Rishab Nithyanand

摘要:Reddit 管理员一般都在努力进行着审核工作,其原因有以下几种:(1)少数人类管理员无法每天跟踪和回应数百万个帖子和评论;(2)担心由于以下原因导致的强烈反对禁止或隔离仇恨社区的行政性决定。因此,正如我们的背景研究所示,行政行为(社区禁令和审查)通常是针对媒体压力而作出的,这种压力是在一个社区内的攻击性话语中蔓延到现实世界中并带来严重后果的。在本文中,我们调查了积极主动调节 Reddit 的可行性 - 即主动识别有可能犯下以前导致其他社区禁令的犯罪风险的社区。主动审核策略有两个原因:

(1)它们有可能缩小管理员需要监控仇恨内容的社区范围;

(2)它们为管理员提供了支持管理决策和干预的科学依据。

我们的工作表明,社区在其用户群和话语主题中不断发展,并且通常可以提前几个月预测演变为仇恨或危险(即被 Reddit 管理员认为需要被禁止)。这使得主动审核成为可能。此外,我们利用可解释的机器学习来帮助确定进入危险社区的最强预测因子。这使管理员能够深入了解处于危险或仇恨风险中的社区的特征。最后,我们大规模调查参与仇恨和危险的次级域名的影响以及社区禁令和隔离区对这些社区成员行为的有效性。

大规模二部图的对抗表示学习

原文标题:

Adversarial Representation Learning on Large-Scale Bipartite Graphs

地址:

http://arxiv.org/abs/1906.11994

作者:

Chaoyang He, Tian Xie, Yu Rong, Wenbing Huang, Junzhou Huang, Xiang Ren, Cyrus Shahabi

摘要:大规模二部图上的图表示是各种应用的核心,从社会网络分析到推荐系统开发。现有方法存在两个主要缺点:

1。无法表征二分特定结构中节点特征的不一致性;

2.不支持大规模的二部图。

为此,我们提出了 ABCGraph,一种用于大规模二部图的无监督学习的可扩展模型。在其核心,ABCGraph 利用所提出的二部图卷积网络(BGCN)作为编码器和对抗性学习作为训练损失,以无监督的方式学习来自两个不同域和二分结构中的节点的表示。

此外,我们设计了一个级联架构来捕获二分结构中的多跳关系,并提高了可扩展性。对不同尺度的多个数据集进行的大量实验验证了 ABCGraph 与现有技术相比的有效性。对于真实世界的大型二部图系统的实验,快速的训练速度和低内存成本证明了 ABCGraph 模型的可扩展性。

基于冗余的分辨率

和基于投影的层间

耦合的多层网络模块化

原文标题:

Modularity in Multilayer Networks using Redundancy-based Resolution and Projection-based Inter-Layer Coupling

地址:

http://arxiv.org/abs/1906.12204

作者:

Alessia Amelio, Giuseppe Mangioni, Andrea Tagarelli

摘要:多层网络的模块化的通用版本又被称为多层模块化。它由两个模型参数表征,即分辨率因子和层间耦合因子。前者对应于层特定相关性的概念,而层间耦合因子表示跨网络层的节点连接的强度。尽管有这种方法的潜力,但是可以任意选择两个参数的设置,而不考虑来自多层网络的拓扑以及可用的社区结构的特定特征。此外,多层模块化并非旨在明确地模拟层上的顺序关系,这对于动态网络而言是最重要的。

本文旨在通过引入多层网络的新模块化公式来克服多层模块化的主要局限性。我们基于多层社区的层内和层间结构提供的信息,修改分辨率和层间耦合因子的作用和语义。此外,我们提出的多层模块化通常足以考虑网络层的排序及其对层耦合的约束。使用最先进的多层群落检测方法在合成和真实多层网络上进行实验。所获得的结果表明了所提出的模块化的意义,揭示了分辨率和层间耦合函数的不同组合的效果。这项工作也代表了开发多层网络中社区检测的新优化方法的起点。

基于稳定性的事后

建筑检查优先级排序方法

原文标题:

A Resilience-based Method for Prioritizing Post-event Building Inspections

地址:

http://arxiv.org/abs/1906.12319

作者:

Ali Lenjani, Ilias Bilionis, Shirley Dyke, Chul Min Yeum, Ricardo Monteiro

摘要:尽管在破坏性事件发生后可能出现各种各样的情况,但每个社区都可以做出选择,以提高其恢复能力或恢复能力。一个富有弹性的社区是一个准备好并因此可以吸收,恢复和适应破坏性事件的社区。恢复阶段的一个重要方面是通过事后建筑检查评估建筑环境中的损坏程度。

在本文中,我们开发并演示了一种基于弹性的方法,旨在通过有限的信息支持有关检查优先级的快速事后决策。该方法使用社区中的建筑物库存的基本特征(建筑面积,楼层数量,构造类型和配置)来为每个建筑物分配特定于结构的脆弱性功能。对于具有给定地震烈度的事件,确定每个建筑物达到特定损坏状态的概率,并用于预测实际建筑状态和检查的优先级。

损失的计算基于建筑物使用类别,估计的检查成本,错误决策的后果以及可能存在不必要的访问限制。其目的是为社区提供一种手段,使其能够根据其建筑物库存检查做出快速的基于成本的决策。我们将决策问题作为整数优化问题,试图最小化社区的预期损失。这种方法的优点在于:

(i)简单,

(ii)需要最少的库存数据,

(iii)易于扩展,

(iv)不需要大量的计算能力。

在危险事件发生之前使用这种方法还可以为社区提供在事件发生之前规划和分配资源的手段,以实现社区所需的弹性目标。

Twitter上分享的

关于MeToo运动的

在线资源:帕累托原则

原文标题:

The Online Resources Shared on Twitter About the #MeToo Movement: The Pareto Principle

地址:

http://arxiv.org/abs/1906.12321

作者:

Iman Tahamtan, Javad Seif

摘要:在本文中,我们将研究 Twitter 用户关于 MeToo 主题标签(#MeToo)的信息共享行为,以及 Pareto 原则是否适用于包含此主题标签的推文中使用的域名和 URL。RStudio 和 Python 用于检索和分析数据。结果表明,最常见的域名是twitter.com(47.20%),其次是nytimes.com(4.42%)和youtube.com(3.69%)。最常见的内容是最近的民意调查显示“男人害怕在 #MeToo 运动后指导女性”。域名表现出帕累托原则:8%的域名占 Twitter上包含 #MeToo 的共享内容的80%。在考虑 URL 时,帕累托原则并不成立。本研究可以更好地了解人们依赖的在线资源来共享有关 #MeToo 运动的信息。

面包屑(Breadcrumbs):

一个具有兴趣点注释的

特征丰富的移动数据集

原文标题:

Breadcrumbs: A Feature Rich Mobility Dataset with Point of Interest Annotation

地址:

http://arxiv.org/abs/1906.12322

作者:

Arielle Moro, Vaibhav Kulkarni, Pierre-Adrien Ghiringhelli, Bertil Chapuis, Benoit Garbinato

摘要:在本文中,我们介绍了面包屑数据库(Breadcrumbs),这是一个从洛桑市(瑞士)收集的移动数据集,来自81个用户的多个手机传感器(GPS,WiFi,蓝牙),为期12周。当前可用的移动性数据集限于通过低时空粒度的单个传感器获得的地理空间信息。

此外,这种被动收集的数据缺乏关于兴趣点及其语义标签的地面实况信息。这些特征对于推动地理空间数据分析的可能性以分析细粒度的移动行为和运动模式至关重要。为此,Breadcrumbs 为所有参与者的兴趣点提供了地面真相和语义标签。数据集还包含参与者之间的细粒度人口统计属性,联系人记录,日历事件和社交关系标签。为了证明地面实况注释的重要性,我们讨论了该数据集的几个用例。

此外,我们比较了四种对比和广泛使用的无监督聚类方法,用于从地理位置轨迹中提取兴趣点。我们使用地面实况信息,我们对这些技术进行了详细的性能验证,并突出了它们的优点和缺点。鉴于移动数据源于个人参与活动的固有需求,缩小原始轨迹数据点与完整行程注释之间的差距至关重要。因此,我们使学术界可以访问面包屑(Breadcrumbs),以促进有监督的人类流动学习方案的研究。

改善快速公交系

统中的公交车流量:基

元胞自动机模拟的方法

原文标题:

Improving the bus flow in a Bus Rapid Transit system: an approach based on cellular automata simulations

地址:

http://arxiv.org/abs/1906.11916

作者:

M.A. Uribe-Laverde, W.F. Oquendo-Patiño

摘要:我们使用基于元胞自动机(CA)的新方法研究了快速公交(BRT)系统中的公交车流量,该方法适当地考虑了公交车的相互作用。该模型使用一个总线服务定量地再现固定和随机停留时间的总线排队行为。对于更多的公共汽车服务,我们的结果表明,公交车流量不仅很大程度上取决于公交车如何在服务中分配,还取决于公交车站在车站的物理布置方式。

迄今为止,在常见的 BRT 优化方法中没有考虑后者的依赖性。通过使用遗传算法,我们可以找到总线分布,最大化站点上给定停靠布置的总线流量,并探索其与总线密度的演变。我们的结果提出了一套指导原则,可以应用于工作 BRT 系统以改善总线流量。

社交媒体用户行为的跨平台建模

原文标题:

Cross-Platform Modeling of Users’ Behavior on Social Media

地址:

http://arxiv.org/abs/1906.12324

作者:

Haiqian Gu, Jie Wang, Ziwen Wang, Bojin Zhuang, Wenhao Bian, Fei Su

摘要:随着移动应用的蓬勃发展和普及,不同的垂直行业积累了丰富的用户信息和社交行为数据,这些数据是自发的,真实的和多样化的。然而,每个平台仅在某些方面描述用户的肖像,导致这些互联网足迹难以组合在一起。在我们的研究中,我们提出了一种建模方法来分析用户在不同社交媒体平台上的在线行为。收集了网易音乐和新浪微博共享的相同用户的结构化和非结构化数据,用于跨平台分析音乐偏好与其他用户特征之间的相关性。

我们使用基于类型和情绪的音乐标签,通过用 K-means 方法计算他们收集的歌曲列表,形成了五组的类型集群和四组情绪集群。此外,在微博用户数据的帮助下,对音乐偏好(即体裁,情绪)和五大人物(BFP)与基本信息(如性别,居住地区,标签)之间的相关性进行了全面研究,全面建立起用户肖像与更精细的纹理。

我们的研究结果表明,人们的音乐偏好可能与他们真实的社交活动有关。例如,生活在山区的人们通常喜欢民间音乐,而城市地区的人们更喜欢流行音乐。有趣的是,狗爱好者可能比猫爱好者更喜欢悲伤的音乐。此外,我们提出的跨平台建模方法可以适应其他垂直方向,提供在线自动方式,以更精确和全面的方式分析用户。

模拟社会网络中

的回声室和极化动态

原文标题:

Modeling echo chambers and polarization dynamics in social networks

地址:

http://arxiv.org/abs/1906.12325

作者:

Fabian Baumann, Philipp Lorenz-Spreen, Igor M. Sokolov, Michele Starnini

摘要:最近,不同社交媒体在几个社会政治背景下量化了回声室和意见两极分化,引发了人们对错误信息传播和辩论开放的潜在影响的担忧。尽管努力越来越多,导致这些现象出现的动态仍然不明朗。在这里,我们提出了一个引入激演化现象的模型,作为一种强化机制,推动从适度的初始条件向极端观点的演变。

在经验上受到社会互动动力的启发,我们认为个体的特点是异质活动和同质性。我们分析地描述了全球共识与人口中新兴激演化动态之间的转变,这是社会影响力和所讨论主题的争议性的一个功能。我们将模型的行为与 Twitter 上的极化辩论的经验数据进行对比,定性地再现观察到的用户参与和意见之间的关系,以及基于交互网络的意见隔离。我们的研究结果揭示了可能存在于社交媒体中回声室和极化的核心的动态。

具有联合表示学习

内容和连接的异常检测

原文标题:

Anomaly Detection with Joint Representation Learning of Content and Connection

地址:

http://arxiv.org/abs/1906.12328

作者:

Junhao Wang, Renhao Wang, Aayushi Kulshrestha, Reihaneh Rabbany

摘要:社交媒体网站正在成为政治的关键因素。这些平台易于操纵,可以用来扭曲信息空间,使选民感到困惑和分散注意力。过去确定破坏性模式的工作主要集中在分析推文的内容上。

在本研究中,我们共同嵌入来自用户发布的内容以及用户的关注者网络的信息,以无人监督的方式检测密集连接的用户组。然后,我们调查这些密集的用户子块以标记异常行为。在我们的实验中,我们研究与即将到来的2019年加拿大选举有关的推文,并观察一组密集联系的用户参与不同省份的地方政治,并表现出类似社交滋事者的行为。

用于广义多任

务学习的图星网络

原文标题:

Graph Star Net for Generalized Multi-Task Learning

地址:

http://arxiv.org/abs/1906.12330

作者:

Lu Haonan, Seth H. Huang, Tian Ye, Guo Xiuyan

摘要:在这项工作中,我们提出了图星网(GraphStar),一种新颖的统一图神经网络结构,它利用消息传递中继和注意机制进行多个预测任务,包括节点分类,图分类和链路预测。GraphStar 解决了图神经网络面临的许多早期挑战,并在不增加模型深度或承担沉重的计算成本的情况下实现了非局部表示。

我们还提出了一种新的方法来解决基于节点分类和文本分类作为图分类的特定主题情感分析。我们的工作表明,“星形节点”可以学习有效的图数据表示,并改进当前三种任务的方法。具体来说,对于图表分类和链路预测,GraphStar 在几个关键基准上的表现优于当前最先进的模型,效率提升约2-5%。

使用社交媒体数据建

模食物受欢迎度依赖性

原文标题:

Modeling Food Popularity Dependencies using Social Media data

地址:

http://arxiv.org/abs/1906.12331

作者:

Devashish Khulbe, Manu Pathak

摘要:主要社交媒体平台的普及使人们能够分享有关他们日常生活的照片和文字信息。关于共享信息的热门话题之一是食物。由于许多关于食物的媒体归因于特定的地点和餐馆,因此可以分析诸如各种美食的时空流行度的普及的信息。跟踪食品类型和零售地点在空间和时间上的流行度对企业主和餐馆投资者也很有用。

在这项工作中,我们提出了一种方法,使用现成的机器学习技术,使用来自社交媒体,Google 图像和 Yelp 的地理标记数据来识别某个地区菜肴类型的趋势和受欢迎程度。在调整时间之后,我们使用核密度估计来获得整个位置的热点,并使用贝叶斯网络模拟食品美食的依赖性。我们将纽约市曼哈顿区视为我们分析的位置,但该方法可用于任何具有社交媒体数据和零售业务信息的区域。

自动发现网络生成过程家族

原文标题:

Automatic Discovery of Families of Network Generative Processes

地址:

http://arxiv.org/abs/1906.12332

作者:

Telmo Menezes (CMB), Camille Roth (CMB)

摘要:设计合理的网络模型通常需要学者们对网络形成的关键驱动因素形成先验直觉。通常,这些直觉由网络演化过程的统计估计支持,这将形成待开发模型的基础。最近引入了机器学习技术以帮助自动发现生成模型。这些方法可以更广泛地描述为“符号回归”,其中基本网络功能产生了动态而不仅仅是参数通过遗传编程演化。

本章首先旨在回顾这方面的原则,努力和新兴文献,这与创造人工科学家的想法非常一致。然后,我们的贡献更具体地旨在建立我们最近开发的方法 [Menezes &Roth,2014],以证明可以通过类似的生成过程描述的网络家族的存在。换句话说,符号回归可用于根据其推断的基因型(就生成过程而言)而不是其观察到的表型(就统计/拓扑特征而言)对网络进行分组。我们的经验案例基于238个匿名的以自我为中心的 Facebook 朋友网络的原始数据集,进一步产生了对社会网络形成的见解。

通过边添加实现K核最大化

原文标题:

K-Core Maximization through Edge Additions

地址:

http://arxiv.org/abs/1906.12334

作者:

Zhongxin Zhou, Fan Zhang, Xuemin Lin, Wenjie Zhang, Chen Chen

摘要:衡量网络稳定性的一种流行模型是 k 核心 - 最大诱导子图,其中每个顶点至少有 k 个邻居。许多研究最大化了 k-core 中的顶点数量,以提高网络的稳定性。在本文中,我们研究边 k 核问题:给定图 G,整数 k 和预算 b,将 B 边添加到 G 中的非相邻顶点对,使得k核最大化。我们证明问题是 NP-Hard 和 APX-Hard 的。在具有有效优化技术的通用图上提出了一种启发式算法。对9个真实数据集的综合实验证明了我们提出的方法的效率性和有效性。

关键边识别:

基于 K-Truss 的模型

原文标题:

Critical Edge Identification: A K-Truss Based Model

地址:

http://arxiv.org/abs/1906.12335

作者:

Wenjie Zhu, Mengqi Zhang, Chen Chen, Xiaoyang Wang, Fan Zhang, Xuemin Lin

摘要:在社会网络中,用户之间关系的强度可以显著影响网络的稳定性。在本文中,我们使用 k-truss 模型来衡量社会网络的稳定性。为了识别关键连接,我们提出了一个新的问题,称为 k-truss 最小化。给定社会网络 G 和预算 b,它旨在找到 b 边以进行删除,这可以导致 G 的 k-truss 中的最大边间断数。我们表明问题是 NP 难的。为了加速计算,开发了新的修剪规则以减小候选大小。此外,我们提出了一种基于上限的策略,以进一步减少搜索空间。我们在真实社会网络上进行综合实验,以证明所提出技术的效率和有效性。

建模城市

原文标题:

Modeling cities

地址:

http://arxiv.org/abs/1906.12342

作者:

Marc Barthelemy

摘要:城市是具有大量成分和单体相互作用的系统,可被视为复杂系统的象征。对这些系统进行建模是一项真正的挑战,并引发了许多学科的兴趣,如定量地理学,空间经济学,地理学和城市化,以及最近的物理学。(统计学)物理学通过提供能够理论和实证结果的工具和概念起着重要作用,我们将在城市的一些基本方面进行说明:表面积和人口的增长,空间组织和空间活动分配。我们将展示最先进的结果和模型,同时也提出我们仍然提出开放性问题以及物理方法可能的用处。我们将结束这篇简短的回顾,讨论建立城市科学的可能性。

几何空间中数据簇团

或网络社区的角可分性

及其与双曲嵌入的关系

原文标题:

Angular separability of data clusters or network communities in geometrical space and its relevance to hyperbolic embedding

地址:

http://arxiv.org/abs/1907.00025

作者:

Alessandro Muscoloni, Carlo Vittorio Cannistraci

摘要:分析以高维度为特征的“大数据”,例如单词向量和复杂网络,通常需要通过在几何空间中表示嵌入。机器学习和网络几何的最新发展已经指出双曲空间可以用于表示由真实复杂物理系统导出的该数据的有用框架。在双曲空间中,节点的径向坐标表征它们的层次结构,而它们之间的角距离表示它们的相似性。

一些研究强调了嵌入在双曲线空间中的节点的角坐标与可用的社区元数据之间的关系。然而,这种分析通常仅限于视觉或定性评估。在这里,我们引入角度分离指数(ASI),以定量评估节点网络社区或数据集群在几何空间的角坐标上的分离。ASI 在双曲线空间中特别有用。

我们对这种用处在此研究中进行了广泛测试,但无论采用何种几何形状,ASI 都可用于角度分离的任何评估。提出 ASI 以及基于均匀随机零模型的精确检验统计量来评估分离的统计显著性。我们证明 ASI 允许发现网络几何中的两个重要现象。首先,二维双曲线网络生成模型中温度的升高,不仅减少了网络聚类,而且还将网络的“维数跳跃”引入到高于2的维度。第二,ASI 可以成功应用于检测在隐藏的几何空间中生长的网络结构的内在维度。

基于主体模型衡

量创造性领导有效性

原文标题:

An Agent-based Simulation of the Effectiveness of Creative Leadership

地址:

http://arxiv.org/abs/1005.1516

作者:

Stefan Leijnen, Liane Gabora

摘要:本文使用 EVOC(一种基于主体的文化演化模型)研究创造性与非创造性领导的有效性。每次迭代,人工社会中的每个主体都会发明一个新动作,或模仿邻居的行为。只有领导者的行为才能被所有其他主体(称为粉丝)模仿。我们使用了两种创造性衡量标准:

(1)发明与模仿比率,iLeader,衡量代理人发明的频率

(2)概念变化率,cLeader,衡量发明的创造性。

高 iLeader 增加了思想的平均适应性,但只有当追随者的创造力很低时。高 iLeader 仅在创意产生的早期阶段与更多的想法相关联。高级领导者在创意创造的早期阶段提高了思想的平均适应性;在后期阶段,它降低了观念适应性。讨论了这些发现的原因以及对人类社会创造性领导的暂时影响。

临近性网络的潜在几何和动态

原文标题:

Latent geometry and dynamics of proximity networks

地址:

http://arxiv.org/abs/1907.00073

作者:

Fragkiskos Papadopoulos, Marco Antonio Rodríguez Flores

摘要:邻近性网络是时变图,表示在物理空间中移动的人之间的距离。在过去的十年中,它们的性质得到了广泛的研究,因为它们严重影响了扩散现象的行为和路由算法的性能。然而,其观察到特征背后的机制仍然难以捉摸。在这里,我们可以证明临近性网络的许多观察到的属性在一个简单的潜在空间网络模型中自然地同时出现,称为动态 S 。

动态 S 不直接模拟节点移动性,但捕获每个快照中的连接性-模型中的每个快照都是 S 的实现传统复杂网络的模型,与双曲几何图同构。通过放弃运动组件,模型方便于数学分析,使我们能够证明接触,接触和重量分布。我们证明这些分布是热力学极限中的幂律,指数位于实际系统中观察到的范围内。有趣的是,我们发现网络温度在网络动态中发挥着核心作用,决定了这些分布的指数,时间单体聚合程度,以及独特和重复组件的形成。

此外,我们表明,范式流行和谣言传播过程在实际和建模网络中表现相似。动态 S 或它的扩展可能适用于其他类型的时变网络,并构成最大似然估计方法的基础,推断真实的系统节点坐标及其在潜在空间中的演化。

使用立场分类

行假新闻检测:一项综述

原文标题:

Fake News Detection using Stance Classification: A Survey

地址:

http://arxiv.org/abs/1907.00181

作者:

Anders Edelbo Lillie, Emil Refsgaard Middelboe

摘要:本文调查并介绍了在立场分类和假新闻检测领域开展的近期学术工作。由于博客中的意见分化,回声室和模型生物问题是对获取高质量数据提出挑战的例子。然而,显示出几种机器学习方法在立场分类方面取得了可喜的成果。一些人使用群体立场进行假新闻检测,例如 [Dungs et al。,2018] 中使用隐马尔可夫模型的方法。此外,特征工程在几种方法中具有重要意义,如 [Aker等,2017] 所示。本文还包括基于所提出的调查的系统实现的提议。

具有顽固链接的社

会网络动态的不稳定性

原文标题:

Instability of social network dynamics with stubborn links

地址:

http://arxiv.org/abs/1907.00352

作者:

Somaye Sheykhali, Amir Hossein Darooneh, Gholam Reza Jafari

摘要:本文基于结构平衡理论研究了存在顽固链接的符号网络。网络中的每个单体都有正负链接的混合,表示友好和敌对的互动以及他对交互的固执。结构平衡理论确认,在具有同时友好/敌对相互作用的签署社会网络中,随着时间的推移,总体趋势是逐渐减少紧张局势。从这个角度来看,个体反复颠倒他们自己的情绪,以减少由不平衡引起的感觉紧张。

在本文中,我们调查了单体固执对其交互的影响。我们将顽固定义为一种抵抗变化的极端对抗性互动。在本文中,我们调查了顽固链路的存在是否会对网络的平衡状态产生影响,以及符号网络中的平衡程度是否取决于顽固链路的位置。我们的结果表明,不均衡的配置由多个拮抗组组成。

分析和仿真结果都表明,网络平衡的全局平衡更多地受到结果网络拓扑中顽固链路的位置的影响,而不是顽固链路的分数。这意味着即使有很大一部分顽固的链接,网络也会向平衡状态发展。另一方面,如果一小部分顽固的链接聚集在五个顽固的社区中,那么网络就会演变成一个不平衡的状态。

使用节点中心性

度量子网中的影响

原文标题:

Influence measures in subnetworks using vertex centrality

地址:

http://arxiv.org/abs/1907.00431

作者:

Roy Cerqueti, Gian Paolo Clemente, Rosanna Grassi

摘要:这项工作涉及评估节点在整个网络及其所属的子网中的影响的问题,适应顶点中心性的经典思想。我们提出了一个涉及整个网络的相对于经典算法的相对顶点中心度量的一般定义。具体来说,我们通过包括单个节点相对于包含它的给定子图的相对影响来给出相对中心度量的分解。建议的相对中心性度量在通过收集 S &P 100资产产生的经验网络中进行测试,重点关注两个特定的中心指数:中介性和特征向量中心性。我们的分析是在时间视角下进行的,在整个网络和资产所属的特定部门中捕获资产对所分析测量的特征的影响。

搜寻效率对个性化

内容图像推荐的影响

原文标题:

Effects of Foraging in Personalized Content-based Image Recommendation

地址:

http://arxiv.org/abs/1907.00483

作者:

Amit Kumar Jaiswal, Haiming Liu, Ingo Frommholz

摘要:推荐系统的主要挑战是帮助用户找到有趣的物品。个性化推荐系统已经变得非常流行,因为它们试图预先确定用户的需求并向他们提供个性化他们的导航的建议。然而,很少有研究解决了什么驱使用户注意集中商品群中的特定内容以及影响选择过程兴趣产生的因素。

为此,我们采用信息搜寻理论(IFT)的视角来进行图像推荐,以展示用户如何利用视觉书签来定位兴趣图像的。我们研究了一个基于个性化内容的图像推荐系统,通过加强基于 IFT 的视觉注意线索来了解影响用户注意力的因素。我们进一步发现,视觉书签(提示)会导致推荐的图像集合更强的察觉能力。本评估基于 Pinterest 图像集。

使用图嵌入的无

监督对抗图对齐

原文标题:

UnsupervisedAdversarial Graph Alignment with Graph Embedding

地址:

http://arxiv.org/abs/1907.00544

作者:

Chaoqi Chen, Weiping Xie, Tingyang Xu, Yu Rong, Wenbing Huang, Xinghao Ding, Yue Huang, Junzhou Huang

摘要:图对齐,也称为网络对齐,是社会网络分析中的基本任务。许多最近的工作依赖于部分标记的交叉图上节点之间的对应关系,即锚链接。但是,由于隐私和安全问题,针对不同场景的锚链的手动标记可能是禁止的。将两个图对齐而没有任何锚链接是一项至关重要且具有挑战性的任务。

在本文中,我们提出了一种无监督的对抗图对齐(UAGA)框架,以完全无监督的方式学习不同图的两个嵌入空间之间的交叉图对齐( 比如没有现有的锚链接,没有用户的个人个人资料或属性信息可用)。所提出的框架学习每个图的嵌入空间,然后尝试通过对抗训练对齐两个空间,然后进行细化过程。

我们进一步将 UAGA 方法扩展为增量 UAGA(iUAGA),迭代地基于伪锚链接显示未观察到的用户链接。这可以用于进一步改善嵌入质量和对准精度。此外,所提出的方法将有益于一些现实世界的应用。例如,社会网络中的链路预测。对真实世界数据的综合实验证明了我们提出的方法 UAGA 和 iUAGA 对无监督图对齐的有效性。

利用社会信号改

进加密货币价格预测

原文标题:

Improved Forecasting of Cryptocurrency Price using Social Signals

地址:

http://arxiv.org/abs/1907.00558

作者:

Maria Glenski, Tim Weninger, Svitlana Volkova

摘要:社交媒体信号已成功用于开发大规模预测和预期分析。例如,预测股市价格和流感爆发。最近,已经探索了社会数据来预测加密货币的价格波动,这是一种具有重大政治和经济影响的新型破坏性技术。

在本文中,我们利用和对比社交信号的预测能力,特别是用户行为和沟通模式,我们使用来自多个社交平台 GitHub 和 Reddit ,以预测具有高开发者和社区兴趣的三种加密货币的价格 - 比特币,以太坊和 Monero 。我们评估神经网络模型的性能,这些模型依赖于历史价格数据和社会数据训练的长期短期记忆单位(LSTM)与仅有价格的 LSTM 和基线自回归综合移动平均线(ARIMA)模型,通常用于预测股票价格。

我们的结果不仅证明了社交信号在预测每日硬币价格时减少了错误,而且还表明 Reddit 论坛上的(r / Bitcoin社区,r / Ethereum 社区和r / Monero社区)官方社区的评论中使用的语言是整体的最佳预测因子。我们观察到,与以太坊(7%)和 Monero(8%)相比,比特币提前一天预测价格(4%均方根误差百分比)更准确。

基于社交媒体的

用户嵌入:文献综述

原文标题:

Social Media-based User Embedding: A Literature Review

地址:

http://arxiv.org/abs/1907.00725

作者:

Shimei Pan, Tao Ding

摘要:自动表示学习是许多最近机器学习成功案例的背后原因。它通常用于将从大数据集(例如,原始文本)学习的知识转移到仅有少量训练样例可用的任务。在本文中,我们回顾了学习在低维嵌入中表示社交媒体用户的最新进展。

该技术对于创建基于社交媒体的高性能人类特征和行为模型至关重要,因为评估潜在人类特征和行为的基本事实通常很难获得大规模。在该调查中,我们回顾了用于从异构用户数据学习统一用户嵌入的典型方法(例如,将社交媒体文本与图像组合以学习统一的用户表示)。最后,我们指出了一些当前的问题和未来的方向。

iPool——层级图神

经网络中基于信息合并

原文标题:

iPool — Information-based Pooling in Hierarchical Graph Neural Networks

地址:

http://arxiv.org/abs/1907.00832

作者:

Xing Gao, Hongkai Xiong, Pascal Frossard

摘要:随着数据科学的出现,对网络或图数据的分析已成为一个非常及时的研究问题。已经提出了各种近期工作,以从谱图论或空间角度将神经网络概括为图。然而,这些工作中的大部分都集中在使卷积运算符适应图表示。与此同时,汇集运算符在提取多尺度和层次表示方面也起着重要作用,但到目前为止它几乎被忽视了。

在本文中,我们提出了一个名为 iPool 的无参数池操作符,它允许在任意图中保留信息量最大的特征。由于信息节点主要表征图信号的论点,我们提出了一个标准来评估给定其邻居的每个节点的信息量,并在理论上证明其与邻域条件熵的关系。此新标准确定如何选择节点并在池化层中构建粗化图。

得到的层次结构产生任意拓扑中的网络数据的有效同构不变表示。所提出的策略是根据公共图表数据集(包括生物信息学和社会网络)的图表分类进行评估,并在大多数数据集上实现最先进的性能。

网络结构与初始群体规

范分布在规范冲突中的作用

原文标题:

The Role of Network Structure and Initial Group Norm Distributions in Norm Conflict

地址:

http://arxiv.org/abs/1907.00888

作者:

Julian Kohne, Natalie Gallagher, Zeynep Melis Kirgil, Rocco Paolillo, Lars Padmos, Fariba Karimi

摘要:社会规范可以通过提供隐含共享的期望和行为准则来促进群体中的社会共存。但是,不同的社会群体可以持有不同的规范,缺乏总体的规范性共识会导致群体内部和群体之间的冲突。

在本文中,我们提出了一个基于主体的模型,该模型模拟了两个相互作用组中规范的采用。我们在改变相对群体大小和同质/异质性(网络结构的两个特征)和初始群体规范分布的同时探索这种现象。代理根据 Granovetter 阈值模型的改编版本,使用均匀分布的阈值来更新其规范。

我们研究网络结构和初始规范分布对实现规范共识的过程的影响以及由此产生的群内和群体间冲突的可能性。我们的结果表明,当规范与群体成员关系密切相关时,规范变化最有可能发生。当网络是嗜异性的时,群体最终会得到最相似的规范分布,其中包括中小型群体。高嗜同性网络显示出高潜在的群际冲突和低潜在的群内冲突,而高嗜异性网络则出现相反的模式。

来源:网络科学研究速递

审校:陈曦

编辑:孟婕

声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。

近期网络科学论文速递

网络流行病模型分析 等10篇

语义神经网络预测科研趋势等12篇赢者通吃——如何赢得网络全球化 等10篇

学术生涯早期与顶尖科学家合作可获得职业竞争优势 等24篇

加入集智,一起复杂!


新浪微博用户画像:基于计算语言特征的建模 | 网络科学论文速递29篇-集智俱乐部

集智俱乐部QQ群|877391004

商务合作及投稿转载|swarma@swarma.org

搜索公众号:集智俱乐部

加入“没有围墙的研究所”

新浪微博用户画像:基于计算语言特征的建模 | 网络科学论文速递29篇-集智俱乐部

让苹果砸得更猛烈些吧!

原文始发于微信公众号(集智俱乐部):集智