集智

心速递

  • 我们观察网络时看到了什么;

  • Kuramoto 振荡器在无标度网络中同步的开始;

  • 论大学课程社会评价的偏见;

  • 在线讨论论坛中使用多模型嵌入的交互式搜索和探索;

  • PocketCare:利用部分观察结果的接近性和症状,通过手机追踪流感;

  • Alt-Right 和全球信息战;

  • 展示共同点促进友谊的形成:大型随机田野实验;

  • 使用新型计算框架进行多类 Twitter 数据分类和地理编码;

  • 量化多边社会网络中的三角闭合;

  • 社交媒体在水文信息学中的应用综述;

  • 有引导的团队划分问题:定义,复杂性和算法;

  • 周期中最大化最小值的份额分配;

  • 斐波那契数列与图模型的纯优先附着机制之间的联系;

  • 挖掘主观感兴趣的属性子图;

  • Tag2Vec:标记网络中的标记表示学习;

  • 通过新闻传播动态和用户表示学习进行谣言检测;

  • Twitter 扩散网络的拓扑比较可靠地揭示了虚假信息新闻;

  • Lanchester 战斗模型的随机版本;

  • 改划选区的混乱:地图投影置换区的紧凑度得分;

  • May-Leonard 模型中的饥饿致死;

  • 在线评论可以预测个股的长期回报;

  • 一种基于加权随机块模型的混合推荐算法;

  • 社交机器人的艺术:综述与分类改进;

我们观察网络时看到了什么

原文标题:

What do we see when we look at networks

地址:

http://arxiv.org/abs/1905.02202

作者:

Tommaso Venturini, Mathieu Jacomy, Pablo Jensen

摘要: 在几种自然科学和社会科学中,越来越普遍的做法是依靠网络可视化作为启发式工具来获得关系数据集的第一个概述,并作为提供网络分析结果说明的一种方式。这种做法已经存在很长时间,足以证明学者们发现在空间上投射网络并观察它们作为拓扑特征代表的视觉外观是有用的。然而,这种做法在很大程度上仍然基于直觉,并没有进行任何调查来明确这种探索的基础和局限。本文通过概念和数学解构力导向布局的功能,并提供有关如何使网络可读和解释其视觉特征的逐步指导。

Kuramoto振荡器在无

标度网络中同步的开始

原文标题:

On the onset of synchronization of Kuramoto oscillators in scale-free networks

地址:

http://arxiv.org/abs/1905.02256

作者:

Thomas Peron, Bruno Messias, Angélica S. Mata, Francisco A. Rodrigues, Yamir Moreno

摘要: 尽管在过去二十年中对复杂网络上的相位振荡器的研究给予了极大的关注,但我们仍然不清楚无标度网络是否在热力学极限中表现出非零临界耦合强度。在这里,我们系统地将异质度平均场(HMF)和淬火平均场(QMF)方法的预测与大型网络上的大量数值模拟进行比较。

我们提供令人信服的证据表明随着无标度网络的振荡器数量的增加,临界耦合消失,其特征在于幂律度分布,指数为 2<γ≤3 ,与其他动力学观察到的一致这种网络中的过程。对于 γ>3 ,我们证明了临界耦合仍然是有限的,与 HMF 计算一致,并突出了相位振荡器的关键特性与无标度网络上的流行病模型之间的现象学差异。最后,我们还研究了在研究复杂网络中的同步现象时的关键选择,即如何规范振荡器之间的耦合。

论大学课程社会评价的偏见

原文标题:

On bias in social reviews of university courses

地址:

http://arxiv.org/abs/1905.02272

作者:

Taha Hassan

摘要: 大学课程排名论坛是一种流行的传播有关课程内容和教学质量的满意度信息的方式,特别是对本科生。大学管理者,教学设计师和教学人员的各种政策决策会影响学生如何看待在课堂和在线课程中使用的教学法的效果。尽管对学术评级网站使用背后的定性驱动因素进行了大量研究,但对于所述论坛上(潜在的)隐性学生对机构层面理想课程结果的偏见几乎没有进行过调查。

为此,我们根据所收集的数据,检查了弗吉尼亚理工大学教授的数百门课程,课程成果(学生报告的GPA)与初级课程指导员的整体排名之间的关系,以及课程结果的性质差异。来自一个流行的学术评级论坛。我们还复制了对美国几所公立大学的分析。我们的实验表明,在学生注册的教授评级中,对于课程结果存在明显的复杂偏见。

在线讨论论坛中使用多模

型嵌入的交互式搜索和探索

原文标题:

Interactive Search and Exploration in Online Discussion Forums Using Multimodal Embeddings

地址:

http://arxiv.org/abs/1905.02430

作者:

Iva Gornishka, Stevan Rudinac, Marcel Worring

摘要: 在本文中,我们提出了一种新颖的交互式多模态学习系统,它有助于在社交多媒体用户的大型网络中进行搜索和探索。它允许分析人员识别和选择感兴趣的用户,并在交互式学习环境中查找类似用户。我们的新型多模型基于用户,单词和概念,它通过部署通用神经嵌入模型同时学习。我们将这些表示显示为不仅可用于对用户进行分类,还可用于自动生成用户和社区配置文件。

受传统总结方法的启发,我们通过从所有可用模态(即文本,图像和用户模态)中选择多样且具有代表性的内容来创建配置文件。使用人工演员评估该方法的有用性,该仿真演员在相关反馈场景中模拟用户行为。进行了多次实验,以评估我们的多模态表示的质量,比较不同的嵌入策略,并确定不同模型的重要性。我们展示了所提出的方法在两个不同的多媒体的能力,这些源自在线极端言论论坛 Stormfront 和博文平台 Twitter,由于它们所具有的讨论语义水平很高,因此特别有趣。

PocketCare:利用部

分观察结果的接近性和

症状,通过手机追踪流感

原文标题:

PocketCare: Tracking the Flu with Mobile Phones using Partial Observations of Proximity and Symptoms

地址:

http://arxiv.org/abs/1905.02607

作者:

Wen Dong, Tong Guan, Bruno Lepri, Chunming Qiao

摘要: 移动电话提供了一个强大的传感平台,研究人员可以通过该平台了解人与人之间的邻近互动以及通过这些相互作用传播疾病,行为和观点。然而,追踪整个社区的基于邻近度的相互作用,然后从一小部分志愿者群体的观察开始模拟疾病和行为的社会传播仍然是一个挑战。在本文中,我们提出了一种新方法,试图将这些稀疏观察结合在一起,使用个体如何相互作用以及社会交互如何在一系列邻近相互作用方面发生的模型。

我们采用我们的方法跟踪流感在3000人大学校园的空间 – 近距离网络中的传播,动员300名来自该人群的志愿者通过蓝牙扫描监控附近的手机,并每日报告他们周围的流感症状。我们的目的是根据她/他的日常生活与志愿者的日常生活相交的频率来预测个体患流感的可能性。因此,我们使用志愿者的日常工作来建立志愿者以及非志愿者的模型。

我们的研究结果表明,我们可以提前两周预测流感感染,平均精确度从0.24到0.35,具体取决于信息量。这种精度比随机猜测模型高6到9倍。在人口水平上,我们可以在两周的窗口中预测感染人群,r 平方值为0.95(随机猜测模型得到的 r 平方值为0.2)。这些结果表明,一种创新的方法可以跟踪与表现出症状的人进行交互的个体,使我们能够警告那些有感染危险的人,并告知健康研究人员接触引起的疾病的进展。

Alt-Right和全球信息战

原文标题:

The Alt-Right and Global Information Warfare

地址:

http://arxiv.org/abs/1905.02712

作者:

Emmi Bevensee, Alexander Reid Ross

摘要: Alt-Right 是一个新法西斯白人至上主义运动,参与暴力极端主义运动,并在广泛的虚假宣传活动中显示出迹象。通过使用社交媒体数据挖掘,本研究可以更深入地了解这些有针对性的虚假宣传活动及其传播方式。它还增加了有关美国极右翼内生和外生影响的现有文献,以及推动虚假宣传活动的激励因素,如地缘政治战略。本研究将作为初步分析,以指出未来的方法和后续研究,这将有助于开发一种综合方法来理解现代法西斯运动的战略和联想。

展示共同点促进友谊的形成:大型随机田野实验

原文标题:

Displaying Things in Common to Encourage Friendship Formation: A Large Randomized Field Experiment

地址:

http://arxiv.org/abs/1905.02762

作者:

Tianshu Sun, Sean J. Taylor

摘要: 友谊的形成对于在线社交网站和社会很重要,但可能会受到信息摩擦的负面影响。在这项研究中,我们证明社会网络可以有效地使用 IT 促进干预 – 在用户(共同的家乡,兴趣,教育,工作,城市)之间展示共同的东西(TIC) – 以鼓励友谊的形成。显示 TIC 更新个人对与另一个人共享相似性的信念,并减少在离线通信中可能难以克服的信息摩擦。与在线社会网络合作,我们进行随机现场实验,当用户浏览非朋友的个人资料时,随机改变不同事物的重要性。

二元水平的外生变化,与观察者概况网络中任何(未)观察到的结构因素正交,使我们能够清晰地隔离 TIC 偏好在驱动网络形成和同质性中的作用。我们发现向观众展示 TIC 可以显著增加他们发送朋友请求和形成友谊的可能性,并且对于几乎没有共同点的人群尤其有效。我们还发现,显示 TIC 可以改善具有不同人口统计特征的各种观众的友谊形成,并且当 TIC 对观众更令人惊讶时更有效。

使用新型计算框架进行多类 Twitter 数据分类和地理编码

原文标题:

Multi-class Twitter Data Categorization and Geocoding with a Novel Computing Framework

地址:

http://arxiv.org/abs/1905.02916

作者:

Sakib Mahmud Khan, Mashrur Chowdhury, Linh B. Ngo, Amy Apon

摘要: 运输数据分析正在成为计算应用的主要领域。运输系统的运行和管理随着计算技术的进步而不断变化。本研究通过一种新颖的计算框架展示了运输数据分析的这种进步。本研究提出了标记的潜在 Dirichlet 分配(L-LDA) – 结合支持向量机(SVM)分类器,其具有支持计算策略,用于在确定交通相关事件时使用公共可用的 Twitter 数据(占总Twitter数据的1%)(即,事件,拥堵,特殊事件,建筑和其他事件),为旅行者提供可靠的信息。

分析方法包括使用文本分类和基于字符串相似性的地理编码位置来分析推文。为纽约市及其周边地区进行的案例研究证明了分析方法的可行性。总共分析了近700,010条推文,以提取相关的运输相关信息一周。对于像纽约市及其周边地区这样的大型地理区域,使用并行计算,与分析交通相关推文的顺序处理相比,实现了30倍的加速。

SVM 分类器在从结构化数据中识别与运输相关的推文方面的准确率达到85%以上。为了进一步将与交通相关的推文分类为子类:事件,拥塞,构造,特殊事件和其他事件,使用三个监督分类器:L-LDA,SVM 和 L-LDA并入 SVM。使用 L-LDA 结合 SVM 的分析框架可以对来自 Twitter 的道路运输相关数据进行分类,准确度超过98.3%,这明显高于独立 L-LDA 和 SVM 所达到的精度。

量化多边社会网络中的三角闭合

原文标题:

Quantifying Triadic Closure in Multi-Edge Social Networks

地址:

http://arxiv.org/abs/1905.02990

作者:

Laurence Brandenberger, Giona Casiraghi, Vahan Nanumyan, Frank Schweitzer

摘要: 多边网络捕获个体之间的重复交互。在社会网络中,这样的边通常形成封闭的三角形或三元组。然而,测量这种三元闭合的标准方法对于多边网络是失败的,因为它们不认为三元组可以由不同多重性的边形成。我们提出了一种基于共享伙伴统计的社会交往多边网络的三元闭包的新方法。我们证明了我们的操作能够在合成和经验多边网络中检测到有意义的闭包,其中常见的方法失败。这是推动从二元网络分析到多边和加权网络分析的推理网络分析的基石,这些分析提供了对社会交互和关系的更真实的表示。

社交媒体在水文信息学中的应用综述

原文标题:

Applications of Social Media in Hydroinformatics: A Survey

地址:

http://arxiv.org/abs/1905.03035

作者:

Yufeng Yu, Yuelong Zhu, Dingsheng Wan, Qun Zhao, Kai Shu, Huan Liu

摘要: 研究和实际应用的洪水将社交媒体数据用于广泛的公共应用,包括环境监测,水资源管理,灾难和应急响应。水文信息学可以从社交媒体技术中受益,新出现的数据,技术和分析工具可以处理大型数据集,可以从中挖掘创意和新价值。

本文首先提出了一个4W(What,Why,When,how)模型和方法结构,以更好地理解和表示社交媒体在水文信息学中的应用,然后提供概述将社交媒体应用于水环境,水资源,洪水,干旱和水资源管理等水文信息学的学术研究。最后,根据前面的讨论,向水文信息管理人员和研究人员提供了数据收集,数据质量管理,虚假新闻检测,隐私问题,算法和平台等与水相关的社交媒体应用的一些高级主题和建议。

有引导的团队划分问题:定义,复杂性和算法

原文标题:

The Guided Team-Partitioning Problem: Definition, Complexity, and Algorithm

地址:

http://arxiv.org/abs/1905.03037

作者:

Sanaz Bahargam, Theodoros Lappas, Evimaria Terzi

摘要: 很多文献都集中在从大量候选人中选择一个人团队的问题,以便尊重某些约束,并使给定的目标函数最大化。尽管现存的研究成功地考虑了不同的目标函数和约束系列,但最常见的限制之一是关注单团队范式。尽管在多个域中有充分记录的应用程序,但当团队构建者需要将整个群体划分为多个团队时,这种模型是不合适的。团队划分任务在教育环境中非常普遍,在教学环境中,教师必须将班级中的学生划分为团队以进行协作项目。当组织需要将员工分成具有特定属性的团队来处理相关项目时,任务也会出现在组织的背景下。

在这项工作中,我们通过引入指导团队分区(GTP)问题来扩展团队形成文献,该问题要求将群体划分为团队,使得每个团队的质心尽可能接近给定的目标向量。正如我们在工作中详细描述的那样,此配方允许团队建设者控制生产团队的组成,并在实际环境中具有自然应用。 GTP 的算法需要同时考虑竞争相同候选人群的多个非重叠团队的组成。这使得问题比专注于优化单个团队的配方更具挑战性。事实上,我们证明 GTP 是 NP -Hard的或是近似的。问题的复杂性促使我们考虑有效的算法启发式算法,我们通过实验和合成数据集的实验来评估。

周期中最大化最小值的份额分配

原文标题:

Maximin share allocations on cycles

地址:

http://arxiv.org/abs/1905.03038

作者:

Zbigniew Lonc, Miroslaw Truszczynski

摘要: 不可分割商品的公平分配问题是社会选择的根本问题。最近,问题扩展到商品形成图表并且目标是将商品分配给单体以使每个单体的群体形成连接子图的情况。对于 最大最小利益公平性标准,研究人员证明,如果商品形成一棵树,那么为每个单体提供至少她的最大商品价值的分配总是存在。

而且,它们可以在多项式时间内找到。我们在这里考虑一个周期的最大最小值分配问题。尽管图表很简单,但问题证明比树版本更难。我们提出了存在最大周期货物份额分配的情况,并提供分配结果,保证每个单体的最大份额的某一部分。我们还研究了用于计算周期中货物的最大份额分配的算法。

斐波那契数列与图模型的纯优先附着机制之间的联系

原文标题:

Handshake between Fibonacci series and pure preferential attachment mechanism on a graph-model

地址:

http://arxiv.org/abs/1905.03039

作者:

Fei Ma, Ding Wang, Ping Wang, Bing Yao

摘要: 为了更好地理解自然和人造复杂系统的动态功能,来自各个学科的许多研究人员,包括统计物理学,数学,理论计算机科学等,花了很多时间来做这个有趣的事情。研究。在本文中,讨论的主题,如何构建合理的图模型,然后使用以前提出的理论模型来解释现实网络的许多特征,仍然是我们的主要工作。

与单一演化方式中许多已有的确定性图模型相比,我们可以使用三种生长方式构建新的图模型,以满足优先连接机制。同时将报告与网络研究相关的几个典型指数。此外,还将展示一些有趣的发现,包括斐波那契系列与“纯”优先附着机制之间的第一次握手,这是一个明显的关系,它连接了两个众所周知的规则,幂律和 Zipf 定律,以及一个常见但有用的等式。生成树数和具有最大叶的生成树数的基础。基于上述讨论,我们可以证明我们的图模型服从幂律和小世界属性。对于未来的研究方向,我们提出了一些未知的问题需要在本文的最后研究。

挖掘主观感兴趣的属性子图

原文标题:

Mining Subjectively Interesting Attributed Subgraphs

地址:

http://arxiv.org/abs/1905.03040

作者:

Anes Bendimerad, Ahmad Mel, Jefrey Lijffijt, Marc Plantevit, Céline Robardet, Tijl De Bie

摘要: 图,数据聚类和局部模型挖掘中的社区检测是数据挖掘和机器学习的三个成熟领域。近年来,归因于子图挖掘正在成为这些领域交叉的新的强大数据挖掘任务。给定每个顶点的图和一组属性,属性子图挖掘的目的是找到内聚子图,其属性值(的一个子集)在某种意义上具有异常值。虽然对这一任务的研究可以借鉴上述三个领域,但图和属性数据的原则整合带来了两个挑战:一种直观的模型语言的定义,有助于高效的搜索策略,以及这种模型的有趣性形式化模型。

我们提出了针对这两个挑战的集成解决方案。所提出的模型语言在高度灵活和直观的基础上改进了先前的工作。我们展示了一个有效且有原则的算法如何枚举这种语言的模型。用于量化该语言模型的兴趣的建议方法植根于信息论,并且能够解释关于数据的先验知识。先前的工作通常基于子图的内聚和单独的属性的异常来量化兴趣,将它们组合在参数化的权衡中。相反,在我们的提案中,这种权衡是以原则性,无参数的方式隐式处理的。大量的实证结果证实了所提出的模型语法是直观的,并且趣味性度量与实际的主观兴趣度很好地对齐。

Tag2Vec:标记网络中的标记表示学习

原文标题:

Tag2Vec: Learning Tag Representations in Tag Networks

地址:

http://arxiv.org/abs/1905.03041

作者:

Junshan Wang, Zhicong Lu, Guojie Song, Yue Fan, Lun Du, Wei Lin

摘要: 网络嵌入是一种学习复杂网络中节点的低维表示向量的方法。在实际网络中,节点可以具有多个标签,但是现有方法忽略标签的丰富语义和分层信息。此信息对许多网络应用程序很有用,通常非常稳定。在本文中,我们提出了一种标签表示学习模型 Tag2Vec,它将节点和标签混合到一个混合网络中。

首先,对于标签网络,我们将语义距离定义为标签之间的接近度,并设计一种新颖的策略,参数化随机游走,自适应地生成具有语义和标签层次信息的上下文。然后,我们提出双曲线 Skip-gram 模型,以较低的输出维度更好地表达复杂的层次结构。我们在 NBER 美国专利数据集和 WordNet 数据集上评估我们的模型。结果表明,我们的模型可以学习具有丰富语义信息的标签表示,并且优于其他基线。

通过新闻传播动态和用户表示学习进行谣言检测

原文标题:

Rumour Detection via News Propagation Dynamics and User Representation Learning

地址:

http://arxiv.org/abs/1905.03042

作者:

Tien Huu Do, Xiao Luo, Duc Minh Nguyen, Nikos Deligiannis

摘要: 谣言已存在很长时间,并因严重后果而闻名。社交媒体平台的快速增长使得谣言的负面影响成倍增加;因此,及早发现它们变得很重要。已经引入了许多方法来使用新闻的内容或社交背景来检测谣言。然而,大多数现有方法忽略或不有效地探索社交媒体中新闻的传播模型,包括社交媒体用户与新闻的跨时间交互的顺序。在这项工作中,我们提出了一种基于深度学习的谣言检测的新方法。我们的方法通过学习用户的表示和用户响应的时间相互关系来利用新闻的传播过程。在 Twitter 和微博数据集上进行的实验证明了所提方法的最新性能。

Twitter 扩散网络的拓扑比较可靠地揭示了虚假信息新闻

原文标题:

Topology comparison of Twitter diffusion networks reliably reveals disinformation news

地址:

http://arxiv.org/abs/1905.03043

作者:

Francesco Pierri, Carlo Piccardi, Stefano Ceri

摘要: 近年来,社交媒体上的恶意信息爆炸式增长,带来严重的社会和政治反弹。最近进行大规模分析的重要研究已经对这个问题产生了更深入的了解,表明虚假信息比社交媒体上的真相更快,更深,更广泛地传播,社交媒体和回声室在传播网络中发挥着重要作用。

根据这些指示,我们探索了对社交媒体上流传的新闻文章进行分类的可能性,这些新闻文章完全基于对其扩散网络的拓扑分析。为此,我们在 Twitter 上收集了一个关于扩散网络的大型数据集,涉及来自主流和虚假信息渠道的新闻文章。我们使用几种无对齐方法对这些网络进行了广泛的比较,包括基本网络属性,中心度量分布和网络距离。

因此,我们评估这些特征在多大程度上允许区分与上述新闻域相关联的网络。我们的研究结果突出了通过单独检查所产生的扩散网络,迅速正确地识别在社交媒体上传播的虚假信息的可能性。

Lanchester战斗模型的随机版本

原文标题:

On a stochastic version of Lanchester’s model of combat

地址:

http://arxiv.org/abs/1905.03122

作者:

Michael J. Kearney, Richard J. Martin

摘要: 兰彻斯特战斗模型由于忽略了随机波动的影响而在标准形式上存在某些缺陷。已经提出了几种纠正这种方法的方法,并且各种结果分散在整个文献中。这里,重新考虑离散时间随机版本,其适合于精确解决方案,目的是在一个设置内导出关键结果。该博览会简化并提供了对早期派生和分析的改进。

改划选区的混乱:地图投影置换区的紧凑度得分

原文标题:

The Gerrymandering Jumble: Map Projections Permute Districts’ Compactness Scores

地址:

http://arxiv.org/abs/1905.03173

作者:

Assaf Bar-Natan, Lorenzo Najt, Zachary Schutzman

摘要: 在政治上的重新划分中,一个地区的紧凑性被用作其公平性的量化代表。几个完善但是存在竞争的地理紧凑性概念通常用于评估区域的形状,包括 Polsby-Popper 评分,凸壳评分和 Reock 评分,这些评分用于比较两个或更多区域或计划。在本文中,我们在数学上证明,从球体到平面的任何地图投影都反转了所有这三个得分中某些区域的得分的排序。根据经验,我们证明了共同墨卡托地图投影对 Reock 分数顺序的影响是非常显著的。

May-Leonard模型中的饥饿死亡

原文标题:

Death by starvation in May-Leonard models

地址:

http://arxiv.org/abs/1905.03182

作者:

P.P. Avelino, B.F. de Oliveira

摘要: 我们考虑空间随机 May-Leonard 模型的动力学,在不同物种的任何两个个体之间具有相等强度的相互捕食相互作用。使用具有两个和三个 pecies 的二维模拟,我们研究了在给定阈值数量的连续不成功捕食尝试之后个体死亡的动态影响。我们发现这些人的死亡会对人口网络的动态产生强烈影响,并为维持共存做出重要贡献。

在线评论可以预测个股的长期回报

原文标题:

Online reviews can predict long-term returns of individual stocks

地址:

http://arxiv.org/abs/1905.03189

作者:

Junran Wu, Ke Xu, Jichang Zhao

摘要: 在线评论是消费者自愿发布的有关其消费体验的反馈。这种反馈表明了客户对品牌或公司的态度,意识和信心等态度,表明了公司未来销售,现金流和股票定价的内在联系。然而,在线评估对股票长期回报的预测能力,特别是在个人层面,几乎没有受到研究关注,需要进行全面的探索以解决现有的争论。

在本文中,该论文完全基于在线评论,建立了一个预测具有胜任绩效的个股长期收益的方法框架。具体而言,从超过1800万个产品评论中推断出的13个类别的6,246个特征被选择用于构建预测模型。使用从交叉验证测试中选择的最佳分类器,与具有10个技术指标为特征的尖端解决方案相比,实现了令人满意的准确度提高13.94%,相对于随机值提高了18.28%。

我们模型的稳健性在现实场景中得到进一步评估和验证。因此,首次确认个股的长期回报可以通过在线评论预测。该研究为投资者提供了对个股长期投资的新机会。

一种基于加权随机块模型的混合推荐算法

原文标题:

A hybrid recommendation algorithm based on weighted stochastic block model

地址:

http://arxiv.org/abs/1905.03192

作者:

Yuchen Xiao, Ruzhe Zhong

摘要: 混合建议通常将协同过滤与基于内容的过滤相结合,以利用两种技术的优点。人们普遍认为混合滤波优于单一算法,因此近年来它已成为电子商务的新趋势。在本文中,我们提出了一种基于加权随机块模型(WSBM)的新型混合推荐系统。我们的算法不仅充分利用基于内容和协同过滤的推荐来解决冷启动问题,而且通过用 WSBM 选择最近邻居来提高推荐的准确性。实验结果表明,与传统的混合推荐相比,我们提出的方法具有更好的预测和分类精度。

社交机器人的艺术:综述与分类的改进

原文标题:

The Art of Social Bots: A Review and a Refined Taxonomy

地址:

http://arxiv.org/abs/1905.03240

作者:

Majd Latah

摘要: 社交机器人代表了新一代机器人,它们利用在线社会网络(OSN)作为命令和控制(C 和C)频道。恶意社交机器人负责发起大规模垃圾邮件活动,推广低价股,操纵用户的数字影响力以及进行政治性的冲击。

本文详细介绍了目前的社交机器人和适当的技术,可以用来在 OSNs 防御的雷达下运行很长一段时间都无法察觉。我们还建议从社会网络角度对检测方法进行精细分类,以及常用数据集及其相应的发现。我们的研究可以帮助 OSN 管理员和研究人员了解恶意社交机器人的破坏性潜力,并可以改善目前针对他们的防御策略。

来源:网络科学研究速递

编辑:孟婕

声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。

近期网络科学论文速递

使用图共注意力网络预测药物合用不良反应 等10篇

社会网络中商业广告的计算模型 等12篇

假新闻早期检测:理论驱动模型 等22篇

时间社会网络上包含错误信息的传播 等11篇

斐波那契树状模型的随机游走:幂律的涌现 等6篇

加入集智,一起复杂!


集智

集智俱乐部QQ群|877391004

商务合作及投稿转载|swarma@swarma.org

搜索公众号:集智俱乐部

加入“没有围墙的研究所”

集智

让苹果砸得更猛烈些吧!

原文始发于微信公众号(集智俱乐部):集智