集智

心速递

  • 复杂网络中的嵌套性:观察、涌现和启示;

  • 多 Agent 市场的信誉系统;

  • 网络之间的相互连接类似一阶渗流变化中的外部场;

  • 深度统一多模态嵌入,用于理解社交媒体网络中的内容和用户;

  • 仿真模型的探索方法;

  • 通过远程监督从 Twitter 学习跨语言嵌入;

  • 不完善私有信号结构的非贝叶斯社会学习;

  • 具有可重新激励节点的关键网络级联:为什么树状近似通常有效,何时崩溃,以及如何纠正它们;

  • 用于边流的基于图的半监督和主动学习;

  • 无人驾驶巴士:同步提高效率;

    • 可扩展的 Gromov-Wasserstein 学习图分割和匹配;

    • 对夏洛茨维尔2017年“团结右翼”集会的在线反应:利用媒体追随者衡量 Twitter 网络的两极分化;

    • 结合基于内容和图的特征检测在线对话中的滥用语言;

    • 基于共轭力模型的行人疏散模拟探索最优旁路策略;

    • 使用自愿汇报的地理信息诊断小空间尺度的人体移动模型的性能;

    • 考虑关系结构的异构信息网络嵌入;

    • 少数人的力量:分析有影响力的用户在协同推荐系统中的影响;

    • T-EDGE:用于以太坊交易网络分析的时间加权多元有向图嵌入;

      • 用于确定实体关系的图距离:欺诈检测的拓扑方法;

      • 理解激进思维:识别信号检测 Twitter上的极端主义内容;

      • 当图挖掘遇到众包:为答案聚合选择专家;

      • Barabasi-Albert 网络的配置模型;

      • 神经图协同过滤;

      复杂网络中的嵌套

      性:观察、涌现和启示

      原文标题:

      Nestedness in complex networks: Observation, emergence, and implications

      地址:

      http://arxiv.org/abs/1905.07593

      作者:

      Manuel Sebastian Mariani, Zhuo-Ming Ren, Jordi Bascompte, Claudio Juan Tessone

      摘要:观察到的生态和社会经济网络架构与随机网络的架构有很大不同。从网络科学的角度来看,在真实网络中观察到的非随机结构模式需要解释它们的出现以及对它们潜在的系统性后果的理解。本文重点介绍其中一种模式:嵌套。给定交互节点的网络,嵌套可以被描述为节点与更好连接的节点的交互伙伴的子集交互的趋势。生物地理学80年以来已知,在生态共生组织,世界贸易,组织间关系等众多系统中已经发现了嵌套性。

      本综述文章重点介绍三个主要支柱:现有的观察网络嵌套的方法;旨在解释生态和社会经济网络中嵌套性出现的主要理论机制;嵌套的交互拓扑对给定交互系统的稳定性和可行性的影响。我们调查了多样化学科的结果,包括统计物理学,图论,生态学和理论经济学。发现嵌套性在二分网络中出现,并且最近在单向网络中出现;这篇综述是第一次统一两种研究流程的综合尝试,通常是相互脱节的。我们相信真正的跨学科努力 – 虽然植根于复杂的系统视角 – 可能激发新的模型和算法,其应用领域无疑将超越学科界限。

      多 Agent 市场的信誉系统

      原文标题:

      A Reputation System for Multi-Agent Marketplaces

      地址:

      http://arxiv.org/abs/1905.08036

      作者:

      Anton Kolonin, Ben Goertzel, Cassio Pennachin, Deborah Duong, Matt Ikle, Nejc Znidar, Marco Argentieri

      摘要:我们基于对相应金融交易的价值加权的显性评级,从其向市场参与者授予“安全性”的能力的角度,通过保护他们免受欺诈和“公平”的真实品质来展示信誉系统的探索。参与者正确评估。我们提出了一种基于所选信誉系统的仿真建模方法,并讨论了仿真结果。

      网络之间的相互连接类

      似一阶渗流变化中的外部场

      原文标题:

      Interconnections between networks act like an external field in first-order percolation transitions

      地址:

      http://arxiv.org/abs/1905.07009

      作者:

      Bnaya Gross, Hillel Sanhedrai, Louis Shekhtman, Shlomo Havlin

      摘要:许多相互依存的现实世界基础设施涉及不同社区或城市之间的相互联系。在这里,我们研究是否以及如何将这种互连的影响描述为经历一阶渗流转变的相互依赖网络的外部场。我们发现,与外部字段相关的关键指数 γ 和 δ 也可以定义为一阶转换,但它们的值与二阶转换的值不同。

      令人惊讶的是,我们发现即使在相互依赖的网络的单个模型中也可以找到两组不同的指数,这取决于依赖性耦合强度。具体而言,一阶区域中的指数 γ (高耦合)不遵循波动耗散定理,而在连续区域(低耦合)则表示。然而,在这两种情况下,它们都满足 Widom 特性, δ−1=γ/β,这进一步支持了他们定义的有效性。我们的结果提供了对相互依赖网络中相变性质的物理直觉,并解释了两组不同指数的根本原因。

      深度统一多模态

      嵌入,用于理解社交

      媒体网络中的内容和用户

      原文标题:

      Deep Unified Multimodal Embeddings for Understanding both Content and Users in Social Media Networks

      地址:

      http://arxiv.org/abs/1905.07075

      作者:

      Karan Sikka, Lucas Van Bramer, Ajay Divakaran

      摘要: 在过去几年中,社交媒体网络上产生的多模式内容爆炸式增长,这使得必须更深入地了解社交媒体内容和用户行为。我们提出了一种新颖的内容独立内容 – 用户 – 反应模型,用于社交多媒体内容分析。与通常单独处理语义内容理解和用户行为建模的先前工作相比,我们在统一框架内提出了对这些问题的通用解决方案。

      我们将开放社交媒体中的用户,图像和文本嵌入到一个共同的多模式几何空间中,使用一种新的损失函数来设计应对远程和不同的模态,从而实现无缝的三向检索。我们的模型不仅优于基于单峰嵌入的跨模态检索任务方法,而且还显示了联合解决Twitter 数据上的两个任务所带来的改进。我们还表明,与在 Instagram 数据上使用单峰内容学习的用户相比,在我们的联合多模式嵌入模型中学习的用户嵌入更能预测用户兴趣。

      因此,我们的框架超越了使用显式领导者 – 跟随者链接信息通过从孤立用户中提取隐含的以内容为中心的从属关系来建立从属关系的先前实践。我们提供定性结果,以显示从学习嵌入中出现的用户群具有一致的语义和我们的模型从嘈杂和非结构化数据中发现细粒度语义的能力。我们的工作表明,社交多模态内容本质上是多模式的,并且具有一致的结构,因为在社会网络中,意义是通过用户和内容之间的交互来创建的。

      仿真模型的探索方法

      原文标题:

      Exploration methods for simulation models

      地址:

      http://arxiv.org/abs/1905.07160

      作者:

      J. Raimbault, D. Pumain

      摘要: 我们首先回想一下,在这一章中,模拟模型在社会科学和人文学科中是绝对必要的,在实验科学方法中,它们只能非常特别地要求它们来构建他们的知识。通过数学模型的形式化能够提供分析解决方案,这通常是不可能的,以便提供令人满意的社会复杂性表示,基于主体的计算模型越来越多地被使用。长期以来,计算机的有限计算能力禁止对模型进行编程,同时考虑到地理上本地化(个人或地区)的大量实体之间的相互作用。

      原则上,这些模型应该告知在宏观地理层面上定义的给定配置的出现的可能性和条件,这些配置来自微观地理层面上发生的相互作用,在具有太多复杂行为的系统中,人类大脑可以理解。然而,这需要研究这些模型的动态行为,包括非线性反馈效应,并验证它们在模拟的所有阶段产生合理的结果。

      在过去十年结束之前,这种探索算法动态的必要阶段仍然相当简陋,当时算法包括更复杂的方法,如演化计算和分布式高性能计算的使用,使得验证方面有了显著的质的飞跃模型,甚至是社会科学和人文学科的认识论转向,建议使用这里描述的 OpenMOLE 平台实现的最新应用。

      通过远程监督从

      Twitter学习跨语言嵌入

      原文标题:

      Learning Cross-lingual Embeddings from Twitter via Distant Supervision

      地址:

      http://arxiv.org/abs/1905.07358

      作者:

      Jose Camacho-Collados, Yerai Doval, Eugenio Martínez-Cámara, Luis Espinosa-Anke, Francesco Barbieri, Steven Schockaert

      摘要: 跨语言嵌入表示同一向量空间中来自不同语言的单词的含义。最近的工作表明,通过对齐独立学习的单语嵌入空间可以构建这样的表示,并且即使没有外部双语数据也可以获得准确的对齐。在本文中,我们探讨了一个在文献中被忽视的研究方向:利用嘈杂的用户生成的文本来学习特别针对社交媒体应用的跨语言嵌入。

      虽然社交媒体类型的噪音和非正式性质对跨语言嵌入方法提出了额外的挑战,但我们发现它还提供了关键机会,因为代码转换的丰富性以及表情符号和命名实体的共享词汇表的存在。我们的贡献在于一个非常简单的后处理步骤,利用这些现象来显著提高最先进的对齐方法的性能。

      不完善私有信号结构

      的非贝叶斯社会学习

      原文标题:

      Non-Bayesian Social Learning with Imperfect Private Signal Structure

      地址:

      http://arxiv.org/abs/1904.02385

      作者:

      Sannyuya Liu, Zhonghua Yan, Xiufeng Cheng, Liang Zhao

      摘要: 作为描述社会网络信念动态的经典模型之一,非贝叶斯社会学习模型假设网络中的成员通过贝叶斯推理过程拥有准确的信号知识。为了使非贝叶斯社会学习模型更适用于人类和动物社会,本文通过假设存在私人信号结构偏差来扩展该模型。

      每个时间步骤中的每个社会成员使用不完美的信号知识来形成其贝叶斯部分信念,然后将其邻居的信念结合到该贝叶斯部分信念中以形成新的信念报告。首先,我们研究了孤立因子的内在学习能力,并推导出信号结构需要满足这种孤立因子的条件才能做出最终的正确决策。根据这些条件,代理人的信号结构进一步分为三种不同的类型,“保守”,“激进”和“消极”。

      然后,我们将上下文从隔离的代理切换到连接的网络;我们的命题和模拟表明,保守主体是社会网络学习真实状态的主导力量,而其他两种类型可能阻止网络成功学习。虽然非贝叶斯社会学习机制确实存在脆弱性,但“更加保守”和“避免过度自信”可能是真实社会网络中每个代理人共同改善社会学习过程和结果的有效策略。

      具有可重新激励节点的关键网络

      级联:为什么树状近似通常有效,

      时崩溃,以及如何纠正它们

      原文标题:

      Critical Network Cascades with Re-excitable nodes: Why tree-like approximations usually work, when they breakdown, and how to correct them

      地址:

      http://arxiv.org/abs/1905.07433

      作者:

      Sarthak Chandra, Edward Ott, Michelle Girvan

      摘要: 我们考虑网络上的级联过程问题。网络级联理论的先前工作通常仅限于本地树状网络或窄类拓扑结构。我们研究了能够对每个节点进行多次重新激发的级联模型,并讨论了树状近似给出良好结果的条件,这些结果到目前为止还没有得到很好的理解。我们还讨论了根据网络中存在的主题计算网络关键性的这种近似值的细分原因。

      我们在这里得到的结果适用于明确不满足局部树状近似的一般网络。特别地,我们关注双平行基序,这是与基于树的理论在有向网络上的离散时间过程的失败相关的最小基序,并且我们得出由于这些基于关键性条件的图的修正。我们验证了我们对计算机生成的网络的主张,这些网络旨在拥有大量的这些模体,并且我们证明了我们的理论很好地预测了观察到的临界偏差。

      数值模拟表明,与基于树的理论的偏差通常很小,并且,使用我们的理论,我们证明了为什么会出现这种情况。此外,我们表明,对于具有较大平均度的网络,这些偏差可以忽略不计,这证明了为什么基于树的理论似乎适用于大多数现实世界的网络。

      用于边流的基于图

      的半监督和主动学习

      原文标题:

      Graph-based Semi-Supervised & Active Learning for Edge Flows

      地址:

      http://arxiv.org/abs/1905.07451

      作者:

      Junteng Jia, Michael T. Schaub, Santiago Segarra, Austin R. Benson

      摘要: 我们提出了一种基于图的半监督学习(SSL)方法,用于学习在图上定义的边流。具体而言,给定边子集的流量测量值,我们希望预测剩余边上的流量。为此,我们开发了一个计算框架,对整体流量施加了某些约束,例如(近似)流量守恒。这些约束使我们的方法与顶点标签的经典基于图的SSL不同,这假设紧密连接的节点共享相似的标签并相应地利用图结构从一些顶点标签外推到未标记的顶点。

      我们得出了方法重建误差的界限,并证明了它在运输,物理基础设施和 Web 上的合成和真实流网络上的强大性能。此外,我们提供了两种主动学习算法,用于选择测量流量的信息边,这些算法具有最佳传感器部署的应用。第一种策略选择边以最小化重建误差界限,并且对于近似无散度的流动很有效。第二种方法是对图表进行聚类,并选择跨越聚类边界的瓶颈边,这对于具有全局趋势的流程非常有效。

      乘坐限制巴士

      :同步提高效率

      原文标题:

      No-boarding buses: Synchronisation for efficiency

      地址:

      http://arxiv.org/abs/1905.07613

      作者:

      Vee-Liem Saw, Lock Yue Chew

      摘要: 我们在一个 N 公共汽车系统中调查了一项无人值守政策,该系统在一个循环中提供 M 巴士站,这是一种夹带机制,可以使公交车在一个合理交错的配置中保持同步。公共汽车总是允许下车,但如果满足某些标准则不允许上车。我们让公共汽车以相同的自然速度移动(适用于可编程自驾车)并分析计算乘客在公交车站等候公交车的平均等待时间。

      我们的分析结果表明,与没有登机政策的情况相比,限制乘坐政策可以大大减少平均等待时间。随后,我们进行模拟以验证这些理论分析,并将模拟扩展到基于实际数据的具有不同自然速度的典型人力驱动总线。最后,我们描述了一种简单的通用自适应算法,用于动态确定何时执行这种政策。

      可扩展的 Gromov-

      Wasserstein 学习图分割和匹配

      原文标题:

      Scalable Gromov-Wasserstein Learning for Graph Partitioning and Matching

      地址:

      http://arxiv.org/abs/1905.07645

      作者:

      Hongteng Xu, Dixin Luo, Lawrence Carin

      摘要: 我们提出了一种可扩展的 Gromov-Wasserstein 学习(S-GWL)方法,并为大规模图分析建立了一种新颖且理论上支持的范例。所提出的方法基于 Gromov-Wasserstein 差异是图上的伪测量的事实。给定两个图,与其 Gromov-Wasserstein 差异相关联的最佳传输提供了它们的节点之间的对应关系并实现了图匹配。当其中一个图具有隔离但自连接的节点( ie,即断开连接的图)时,最佳传输指示另一个图的聚类结构并实现图分区。

      使用这个概念,我们通过学习多个观察图的 Gromov-Wasserstein 重心图,将我们的方法扩展到多图分区和匹配;重心图起到断开图的作用,因为它是学习的,所以聚类也是如此。我们的方法结合了一个递归的 K -partition 机制和一个正则化的近端梯度算法,其时间复杂度为O(K(E+V)logKV),用于 V 节点和 E的图 edge。据我们所知,我们的方法是第一次尝试使 Gromov-Wasserstein 差异适用于大规模图分析,并将图分区和匹配统一到同一框架中。它优于最先进的图分区和匹配方法,实现了准确性和效率之间的权衡。

      对夏洛茨维尔2017年“团结右翼”

      集会的在线反应:利用媒体追随

      者衡量 Twitter 网络的两极分化

      原文标题:

      Online reactions to the 2017 ‘Unite the Right’ rally in Charlottesville: measuring polarization in Twitter networks using media followership

      地址:

      http://arxiv.org/abs/1905.07755

      作者:

      Joseph H. Tien, Marisa C. Eisenberg, Sarah T. Cherng, Mason A. Porter

      摘要: 我们使用网络分析和数据科学的工具,研究了2017年8月在弗吉尼亚州夏洛茨维尔举办的“ Unite the Right ”集会后的 Twitter 对话。我们在 Twitter 和主成分分析(PCA)上使用媒体关注来计算一维轴上的“左”/“右”媒体分数以表征节点。然后,我们与转推关系一起使用这些分数来检查与 #Charlottesville 主题标签进行通信的大约300,000个帐户的转发网络的结构。

      转发网络是极端分化的,相对于媒体 PCA 得分的符号,其协调系数为0.8。使用两种方法( Louvain 方法和 InfoMap )进行社区检测,在左/右节点组成方面产生大部分同质社区。在比较推文内容时,我们发现关于“特朗普”的推文在左翼和右翼都很普遍,尽管伴随的语言并不令人惊讶。

      左派社区中具有大学位的节点包括与不同领域相关的帐户,包括激进主义,商业,艺术和娱乐,媒体和政治。支持唐纳德特朗普是权利社区中的共同点,将社区与引用白人至上主义仇恨符号的帐户,具有影响力的人物的社区连接在一起,以及最大的权利社区(包括 Twitter 帐户 FoxNews )。

      结合基于内容和图的特征

      检测在线对话中的滥用语言

      原文标题:

      Abusive Language Detection in Online Conversations by Combining Content-and Graph-based Features

      地址:

      http://arxiv.org/abs/1905.07894

      作者:

      Noé Cecillon (LIA), Vincent Labatut (LIA), Richard Dufour (LIA), Georges Linarès (LIA)

      摘要: 近年来,在线社会网络已经允许全球用户会面和讨论。作为这些社区的担保人,这些平台的管理员必须阻止用户采取不当行为。由于要检查的消息量不断增加,这种主要由人类完成的验证任务越来越困难。已经提出了使该调节过程自动化的方法,主要是通过提供基于交换消息的文本内容的方法。

      最近的工作还表明,以会话图的形式从会话结构中得出的特征可以帮助检测这些滥用的消息。在本文中,我们建议通过提出集成基于内容和图的特征的融合方法来利用这两种信息来源。我们对原始聊天记录的实验表明,消息的内容以及它们在对话中的动态包含部分补充信息,允许在滥用消息分类任务上进行性能改进,最终F-度量为93.26%。

      基于共轭力模型的行人疏

      散模拟探索最优旁路策略

      原文标题:

      Simulation of Pedestrian Evacuation Using Conjugated Forces Model to Explore the Optimal Bypassing Strategy

      地址:

      http://arxiv.org/abs/1905.07949

      作者:

      Xiaolu Jia, Hao Yue, Dongliang He

      摘要: 提出并采用能够再现旁路行为的共轭力模型(CFM)来模拟行人疏散。首先,冲突和规避以及超越行为的概念被特别定义为描述所提出的 CFM。行人可以通过 CFM 描述的行人将在遇到碰撞时改变他想要的方向,并选择主动绕过其他人。其次,模拟通道中的行人运动以证明 CFM 再现微观绕行行为的能力,然后引入旁路参数来描述不同的运动策略。最后,模拟一个出口房间的疏散,以找到最佳的旁路策略。可以得出结论,最佳旁路策略随着出口宽度和初始行人数的不同而变化。

      使用自愿汇报的地理信息诊断小

      空间尺度的人体移动模型的性能

      原文标题:

      Diagnosing the performance of human mobility models at small spatial scales using volunteered geographic information

      地址:

      http://arxiv.org/abs/1905.07964

      作者:

      Chico Q. Camargo, Jonathan Bright, Scott A. Hale

      摘要: 对当地人口流动模式进行准确建模是当前城市决策者关注的核心问题,既影响公共交通资源的短期部署,也影响交通基础设施的长期规划。然而,虽然宏观层面的人口流动模型(如重力和辐射模型)得到了很好的发展,但微观层面的替代品供应却要短得多,大多数宏观模型已知在较小的地理范围内表现不佳。在本文中,我们采取了第一步来弥补这一不足,通过利用两个新的数据集来分析人类流动的宏观模型在何种程度上以及为何在小范围内崩溃。

      特别是,我们使用来自主要移动应用程序的匿名聚合数据集,并将其与来自 OpenStreetMap 的免费可用数据相结合,该数据涉及英国牛津郡周围不同地区的土地利用组成。我们展示了不同模型失败的地方,并为新的建模策略提供了理由,该策略超越了诸如距离和人口规模等粗略启发式,以及对城市不同区域所呈现的机会的详细,细致的理解。

      考虑关系结构的

      异构信息网络嵌入

      原文标题:

      Relation Structure-Aware Heterogeneous Information Network Embedding

      地址:

      http://arxiv.org/abs/1905.08027

      作者:

      Yuanfu Lu, Chuan Shi, Linmei Hu, Zhiyuan Liu

      摘要: 异构信息网络(HIN)嵌入旨在将多种类型的节点嵌入到低维空间中。尽管大多数现有的 HIN 嵌入方法都考虑了 HIN 中的异构关系,但它们通常对所有关系采用单一模型而没有区别,这不可避免地限制了网络嵌入的能力。在本文中,我们考虑了异构关系的结构特征,提出了一种新的关系结构感知异构信息网络嵌入模型(RHINE)。

      通过全面的数学分析探索现实世界网络,我们提出了两种与结构相关的测量方法,可以将异构关系一致地分为两类:关联关系(AR)和交互关系(IR)。为了尊重关系的独特特征,我们在 RHINE 中提出了专门用于处理 AR 和 IR 的不同模型,这些模型可以更好地捕获网络的结构和语义。

      最后,我们以统一和优雅的方式组合和优化这些模型。对三个真实数据集的大量实验表明,我们的模型在各种任务中明显优于最先进的方法,包括节点聚类,链路预测和节点分类。

      少数人的力量:分析有影响

      力的用户在协同推荐系统中的影响

      原文标题:

      Power of the Few: Analyzing the Impact of Influential Users in Collaborative Recommender Systems

      地址:

      http://arxiv.org/abs/1905.08031

      作者:

      Farzad Eskandanian, Nasim Sonboli, Bamshad Mobasher

      摘要: 与其他社交系统一样,在协同过滤中,少数“有影响力”的用户可能对其他用户的推荐产生很大影响,从而影响系统的整体行为。识别有影响力的用户并研究他们对其他用户的影响是一个重要问题,因为它提供了对小团体如何无意或有意地影响整个系统行为的深入了解。对这些影响进行建模还可以揭示难以辨别的模式和关系,希望能够提高系统生成个性化内容的透明度。

      在这项工作中,我们首先使用影响歧视模型将协作过滤中的“影响”概念形式化。然后,我们根据经验识别和表征有影响力的用户,并分析他们在不同的基础推荐算法和三个不同的推荐域中对系统的影响:工作,电影和书籍推荐。这些实验的见解有助于设计不仅针对准确性进行优化的系统,而且还可以调整以减轻有影响力的用户在可能导致系统结果的潜在不平衡或不公平时的影响。

      T-EDGE:用于以太坊交易网络

      分析的时间加权多元有向图嵌入

      原文标题:

      T-EDGE: Temporal WEighted MultiDiGraph Embedding for Ethereum Transaction Network Analysis

      地址:

      http://arxiv.org/abs/1905.08038

      作者:

      Jiajing Wu, Dan Lin, Zibin Zheng, Qi Yuan

      摘要: 最近,图嵌入技术已广泛用于各种网络的分析,但是大多数现有的嵌入方法省略了可能在金融交易网络中起作用的边的时间和加权信息。基于区块链的平台以太坊的开放性为我们提供了前所未有的数据挖掘机会。通过考虑交易网络的现实规则和特征,我们建议将以太坊交易网络建模为时间加权多重图(TWMDG),其中每个节点都是一个唯一的以太坊账户,每个边代表一个按金额加权并分配时间戳的交易。

      在 TWMDG 中,我们通过结合边的时间和加权信息来定义时间加权多重图嵌入(T-EDGE)的问题,目的是捕获动态交易网络的更全面的属性。为了评估所提出的嵌入方法的有效性,我们对从以太坊收集的真实世界交易数据进行预测任务的实验,包括时间链路预测和节点分类。实验结果表明,T-EDGE 优于基线嵌入方法,表明时间相关的行走和边的多重性特征对于时间敏感的交易网络而言是必要的和必不可少的。

      用于确定实体关系的图

      距离:欺诈检测的拓扑方法

      原文标题:

      Graph distances for determining entities relationships: a topological approach to fraud detection

      地址:

      http://arxiv.org/abs/1905.08040

      作者:

      J.M. Calabuig, H. Falciani, A. Ferrer-Sapena, L.M. García-Raffi, E.A. Sánchez-Pérez

      摘要: 给定 Ω 和接近函数ϕ:Ω×Ω→R+,我们通过考虑 Omega 中的路径距离来定义 Omega 的新指标,这被视为一个完整的图表。我们分析了这种距离的属性,以及定义初始邻近矩阵的几个过程 (ϕ(a,b))(a,b)∈Ω×Ω。我们的机有它的根据当前的兴趣,找到有效的算法来检测和分类社会网络的元素之间的关系。

      例如,分析为特定公共管理部门工作的一组公司或需要自动欺诈检测系统的其他数字。使用这种形式主义,我们陈述了关于欺诈检测的主要观点,其基础是可以检测到欺诈,因为它在以这种方式定义的度量空间中产生有意义的局部密度变化。

      理解激进思维:识别信号检

      测Twitter上的极端主义内容

      原文标题:

      Understanding the Radical Mind: Identifying Signals to Detect Extremist Content on Twitter

      地址:

      http://arxiv.org/abs/1905.08067

      作者:

      Mariam Nouh, Jason R. C. Nurse, Michael Goldsmith

      摘要: 互联网,特别是在线社会网络改变了恐怖主义和极端主义团体影响和激进个人的方式。最近的报告显示,这些群体的运作模式首先是将广泛的受众暴露在极端主义在线资料中,然后再迁移到较不开放的在线平台以进一步激演化。因此,在线识别激进内容对于限制极端主义叙事的范围和传播至关重要。

      在本文中,我们的目标是确定自动检测社交媒体中激进内容的措施。我们确定了几个信号,包括文本,心理和行为,它们共同允许对激进信息进行分类。我们的贡献是三方面的:

      (1)我们分析极端主义团体发布的宣传材料,并创建基于文本的基本内容模型,

      (2)我们建立了从这些材料推断的心理属性模型,

      (3)我们在 Twitter 上评估这些模型,以确定自动识别在线激进推文的程度。

      我们的研究结果表明,激进的用户确实展现出可区分的文本,心理和行为属性。我们发现心理属性是最显著的特征之一。此外,我们的结果表明,使用矢量嵌入功能的文本模型显著改善了对 TF-IDF 特征的检测。我们验证了两种实现高精度的实验方法。我们的研究结果可用作检测在线激演化活动的信号。

      当图挖掘遇到众包:

      为答案聚合选择专家

      原文标题:

      Graph Mining Meets Crowdsourcing: Extracting Experts for Answer Aggregation

      地址:

      http://arxiv.org/abs/1905.08088

      作者:

      Yasushi Kawase, Yuko Kuroki, Atsushi Miyauchi

      摘要: 汇总群众工作者的反应是众包过程中的一项基本任务。如果少数专家被大量非专家淹没,大多数答案聚合算法(如多数投票)都无法确定正确的答案。因此,从人群中提取可靠的专家至关重要。在这项研究中,我们引入了“专家核心”的概念,这是一组不太可能包含非专家的工人。我们设计了一种基于图挖掘的高效算法,可精确计算专家核心。

      为了回答聚合任务,我们提出了两种算法。第一个将专家核心结合到现有的答案聚合算法中,例如多数表决,而第二个利用专家核心提取算法提供的与工作人员可靠性有关的信息。然后,我们为第一种算法提供理论依据。使用合成和真实数据集的计算实验表明,我们提出的答案聚合算法优于最先进的算法。

      Barabasi-Albert 网络的配置模型

      原文标题:

      The configuration model for Barabasi-Albert networks

      地址:

      http://arxiv.org/abs/1905.08093

      作者:

      M.L. Bertotti, G. Modanese

      摘要: 我们开发并测试了一种重连方法(最初由 Newman 提出),该方法允许构建具有预先指定的度分布和两点相关性的随机网络。对于无标度学位分布的情况,我们根据 Dorogovtsev 和 Mendes 的一般处方对分布的尾部进行离散化。由于最近对其相关性的分析结果,该方法应用于 Barabasi-Albert(BA)网络是可能的,并且允许将配置模型中生成的随机网络的集合与从优先附着获得的“真实”网络的集合进行比较。

      对于 β≥2( β 是优先连接方案中的父节点数),使用配置模型获得的网络完全连接(巨大组件等于100%)。在两种生成方案中,通过函数 knn 的计算证明了小程度节点的明显不协调性。我们还开发了一种有效的重连方法,它可以产生可调系数变化系数 r ,我们用它来获得具有相同度数分布的 BA 网络的最大不匹配网络给定 β 。该方法的可能应用涉及各种社会网络。

      神经图协同过滤

      原文标题:

      Neural Graph Collaborative Filtering

      地址:

      http://arxiv.org/abs/1905.08108

      作者:

      Xiang Wang, Xiangnan He, Meng Wang, Fuli Feng, Tat-Seng Chua

      摘要: 学习用户和项目的向量表示(即嵌入)是现代推荐系统的核心。从早期矩阵分解到最近出现的基于深度学习的方法,现有的努力通常通过映射来自描述用户(或项目)的预先存在的特征(例如 ID 和属性)来获得用户(或项目)的嵌入。我们认为这种方法的固有缺点是,在用户项交互中潜伏的协作信号不在嵌入过程中编码。因此,所得到的嵌入可能不足以捕获协同过滤效果。

      在这项工作中,我们建议将用户 – 项目交互 – 更具体地说是二部图结构 – 集成到嵌入过程中。我们开发了一个新的推荐框架 Neural Graph Collaborative Filtering(NGCF),它通过在其上传播嵌入来利用用户项目图结构。这导致用户项图中的高阶连通性的表达建模,有效地将协作信号以明确的方式注入到嵌入过程中。

      我们对三个公共基准进行了广泛的实验,证明了对 HOP-Rec 和协同记忆网络等几个最先进模型的重大改进。进一步分析验证了嵌入传播对于学习更好的用户和项目表示的重要性,证明了NGCF的合理性和有效性。可从https://github.com/xiangwang1223/neural_graph_collaborative_filtering获取代码。

      来源:网络科学研究速递

      编辑:孟婕

      声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。

      近期网络科学论文速递

      人们会信任什么样的线上社交团体? 等20篇

      限制在线社会网络应用程序的隐私泄漏 等11篇

      剖析用于图分类的图神经网络 等21篇

      生物学与物理学之间的跨学科关系 等12篇

      当人们经历了负面的生活影响和缺乏控制 等25篇

      加入集智,一起复杂!


      集智

      集智俱乐部QQ群|877391004

      商务合作及投稿转载|swarma@swarma.org

      搜索公众号:集智俱乐部

      加入“没有围墙的研究所”

      集智

      让苹果砸得更猛烈些吧!

      原文始发于微信公众号(集智俱乐部):集智