集智

核心速递

  • 比特币网络的污点分析;

  • 预测媒体和热门Twitter用户的主题立场;

  • 丹麦立场分类和谣言决议;

  • 在线社会网络中用户品牌定位的语义方法;

  • 基于反向贪心方法识别重要节点;

  • 广义随机漫游对模型;

  • 混乱期间向英国政府提交的请愿的内容、时间和地点;

  • 社会网络驱动的智能车辆互联网推荐的模拟研究;

  • 自适应学习社交朋友偏好的神经注意模型;

  • 协同过滤中跨域损失的自适应深度学习;

  • dK随机图的隐私性;

  • 具有完全采用反馈的独立级联模型影响最大化的适应性差距;

  • 捷克电网异常与地磁活动相关性的统计分析;

  • 无标度优先连接模型中的加权距离;

比特币网络的污点分析

原文标题:

Taint analysis of the Bitcoin network

地址:

http://arxiv.org/abs/1907.01538

作者:

Uroš Hercog, Andraž Povše

摘要:确定个人比特币钱包的信任是一个难题。没有评级,提供供应商或交换有关他们收到的比特币污染程度的有意义的信息。如果收到的比特币被盗或非法取走,则缺乏此类信息会使交易承担责任。在本文中,我们尝试通过引入一个名为TaintRank的比特币地址污点分数来解决这个问题。它通过考虑整个历史记录中与之交互的地址,提供对特定钱包的深入了解。这种排名方法为比特币交易所公司提供了与他们交易对象的洞察力。

预测媒体和热门Twitter用户的主题立场

原文标题:

Predicting the Topical Stance of Media and Popular Twitter Users

地址:

http://arxiv.org/abs/1907.01260

作者:

Peter Stefanov, Kareem Darwish, Preslav Nakov

摘要:当今有争议的社会和政治问题促使人们在社会网络上发表意见,高频分享在线媒体文章的链接,并重新发布平台的重要成员的陈述。对于社会统计学家和政策制定者来说,了解人们和整个媒体对当前有争议话题的立场非常重要。虽然现在存在许多用于确定视点的监督解决方案,但是手动注释训练数据是非常昂贵的。在本文中,我们提出了一种使用无监督学习的方法,通过利用用户的转推行为,能够表征在线媒体和流行Twitter用户的一般政治倾向,以及他们对有争议话题的立场。我们通过将偏差预测与媒体偏差 / 事实检测网站的金标签进行比较来评估模型,并进一步进行人工分析。

丹麦立场分类和谣言决议

原文标题:

Danish Stance Classification and Rumour Resolution

地址:

http://arxiv.org/abs/1907.01304

作者:

Anders Edelbo Lillie, Emil Refsgaard Middelboe

摘要:互联网上充斥着通过博客和社交媒体传播的谣言。最近的研究表明,分析人群对谣言的立场是确定其真实性的一个很好的指标。一个最先进的系统使用了LSTM神经网络。通过考虑整个分支的上下文自动对Twitter上的帖子进行分类,而另一个更简单的决策树分类器,通过执行仔细的特征工程也能得到类似的效果。预测谣言真实性的一种方法是使用立场作为隐马尔可夫模型(HMM)的唯一特征。本论文为丹麦语言生成了一个带有注释的Reddit数据集,并实现了各种站点分类模型。其中,线性支持向量机提供了最佳结果,精度为0.76,宏观F1得分为0.42。此外,实验表明,可以跨语言和平台使用立场标签与HMM来预测谣言的准确性,达到0.82的准确度和0.67的F1得分。仅依靠丹麦数据集即可获得更高的分数。在这种情况下,准确性预测的准确度为0.83,F1为0.68。最后,当为HMM使用自动立场标签时,仅观察到性能的小幅下降,表明所实现的系统可以具有实际应用。

在线社会网络中

用户品牌定位的语义方法

原文标题:

A Semantic Approach for User-Brand Targeting in On-Line Social Networks

地址:

http://arxiv.org/abs/1907.01326

作者:

Mariella Bonomo, Gaspare Ciaccio, Andrea De Salve, Simona E. Rombo

摘要:我们基于在线社会网络配置文件之间的比较,提出了可能的客户(用户)对广告商(例如,品牌)的推荐的一般框架。特别地,我们将用户和品牌简档表示为树,其中节点对应于相关联的在线社会网络中的类别和子类别。当类别涉及帖子和评论时,比较基于单词嵌入,这允许分析品牌简档中流行的主题与用户偏好之间的相似性。真实数据集上的结果表明,我们的方法成功地识别了用作给定广告活动的目标的最合适的用户集。

基于反向贪心方法识别重要节点

原文标题:

Identifying vital nodes based on reverse greedy method

地址:

http://arxiv.org/abs/1907.01388

作者:

Tao Ren, Zhe Li, Yi Qi, Yixin Zhang, Simiao Liu, Yanjie Xu, Tao Zhou

摘要:识别维持网络连接的重要节点是网络科学中长期存在的挑战。在本文中,我们提出了一种所谓的反向贪婪方法,其中优先选择最不重要的节点,以使相应的诱导子图中最大分量的大小尽可能小。因此,稍后选择的节点在维持连接性方面更重要。我们对十个真实网络的实证分析表明,反向贪婪方法的表现明显优于众所周知的最先进方法。

广义随机漫游对模型

原文标题:

Generalized Random Surfer-Pair Models

地址:

http://arxiv.org/abs/1907.01420

作者:

Sai Kiran Narayanaswami, Balaraman Ravindran, Venkatesh Ramaiyan

摘要:SimRank是一种被广泛研究的基于链接的相似性度量方法,以其简单但强大的理念而闻名,如果它们被类似节点引用,则两个节点是相似的。虽然这种理念已成为若干改进度量的基础,但对于称为随机漫游对模型的SimRank,还有另一种有用的,尽管不太常见的解释。在这项工作中,我们表明其它与SimRank相关的众所周知的测量也可以使用随机漫游对模型重新解释,并为几个基于链接的相似性度量建立数学上合理,通用和统一的框架。这也有助于提供对其功能的新见解,并允许在蒙特卡洛框架中使用这些措施,这提供了若干计算益处。接下来,我们将描述如何将框架用作根据给定设计要求开发测量的多功能工具。作为该实用程序的一个例证,我们通过结合该框架下两个现有措施的益处来开发一种新措施,并且凭经验数据证明它可以产生更好的绩效指标。

混乱期间向英国政府

提交的请愿的内容、时间和地点

原文标题:

What, When and Where of petitions submitted to the UK Government during a time of chaos

地址:

http://arxiv.org/abs/1907.01536

作者:

Bertie Vidgen, Taha Yasseri

摘要:在政治动荡和不确定性以及不断加剧的分裂和超党派关系的时代,各国政府需要利用其掌握的每一种工具来理解和回应其公民的关切。我们研究了2015-2017期间英国公众向政府提出的问题(围绕英国欧盟成员国公民投票),从10,950份请愿书(代表3050万签名)的数据集中挖掘公众意见。我们用基础自然语言处理(NLP)方法和latent Dirichlet allocatio(LDA)方法提取主要问题。我们研究它们的时间动态和地理特征。我们表明,尽管一些问题的普及在两年内保持稳定,但其他问题在很大程度上受到外部事件的影响,例如2016年6月的公民投票。我们还研究了请愿问题与其签署人在地理位置上的关系。我们表明,一些问题得到了全国的支持,但其他问题则更为本地化。然后,我们根据成员签署的问题确定六个不同的选区群。最后,我们通过比较请愿问题和Ipsos MORI调查数据中报告的最重要问题来验证我们的方法。这些结果显示了计算分析请愿书的巨大力量,不仅可以了解公民关心的问题,而且可以了解他们何时何地请愿。

社会网络驱动的

智能车辆互联网推荐的模拟研究

原文标题:

A Simulation Study of Social-Networking-Driven Smart Recommendations forInternet of Vehicles

地址:

http://arxiv.org/abs/1907.01101

作者:

Kashif Zia, Arshad Muhammad, Dinesh Kumar Saini

摘要:在权衡物联网(IoT)潜力的同时,往往忽略了社会层面的连通性和信息分散。在车辆互联网(IoV)的专业领域,社会IoV(SIoV)的引入呈现了它的重要性。假设IoV能产生的大数据更普遍容易标准化,使其富有成效的社交利用仍然是一个挑战。在本文中,我们提出了基于主体的车辆之间信息共享模型,用于环境感知建议。该模型遵循人类社会的社会维度。在合理的连接和数据约束下测试了一些重要的假设。仿真结果表明,社会关系的封闭及其时机影响了新信息的分散(推荐系统所必需的)。我们还观察到,随着网络逐渐增加的互动而发展,建议保证在同等优秀的竞争对手之间公平分配车辆是不可能的。

一个自适应学习社交偏好的神经注意模型

原文标题:

A Neural Attention Model for Adaptive Learning of Social Friends’ Preferences

地址:

http://arxiv.org/abs/1907.01644

作者:

Dimitrios Rafailidis, Gerhard Weiss

摘要:基于社交的推荐系统利用朋友的选择来对抗用户偏好的数据稀疏性,并提高协同过滤策略的推荐准确性。这个策略的主要的挑战是如何捕捉和权衡朋友的偏好,因为在实践中他们必然匹配。在本文中,我们提出了一种用于社会协同过滤的神经注意机制,即NAS。我们设计了一种神经架构,通过考虑朋友对用户行为的社会潜在影响,仔细计算朋友偏好中的非线性。此外,我们引入社交行为关注机制来自适应地权衡朋友对用户偏好的影响,从而生成准确的推荐。我们在公开数据集上的实验证明了所提出的NAS模型相对于其他最先进方法都具有有效性。此外,我们研究了所提出的社会行为关注机制的效果,并表明它是我们模型表现的关键因素。

针对协同过滤中

跨域损失的自适应深度学习模型

原文标题:

Adaptive Deep Learning of Cross-Domain Loss in Collaborative Filtering

地址:

http://arxiv.org/abs/1907.01645

作者:

Dimitrios Rafailidis, Gerhard Weiss

摘要:如今,用户在社交媒体平台和电子商务网站上打开多个帐户,在不同的域名上表达他们的个人偏好。但是,用户的行为会跨域更改,具体取决于用户与之交互的内容,例如电影,音乐,服装和零售产品。在本文中,我们提出了一种用于跨域推荐的自适应深度学习策略,称为ADC。我们设计了一个神经架构并制定了跨域丢失函数,以计算跨域用户偏好的非线性,并相应地传递用户多种行为的知识。此外,我们引入了一种有效的跨域损失平衡算法,该算法直接调整梯度幅度,并在通过反向传播训练模型时根据域的复杂性/尺度调整学习速率。在这样做时,ADC在优化模型参数时控制并调整每个域名的贡献。我们对六个公开可用的跨域推荐任务的实验证明了ADC模型相对于其他最先进方法的有效性。此外,我们研究了我们的自适应深度学习策略的效果,并表明ADC可以很好地平衡具有不同复杂性的域的影响。

dK随机图的隐私性

原文标题:

On the Privacy of dK-Random Graphs

地址:

http://arxiv.org/abs/1907.01695

作者:

Sameera Horawalavithana, Adriana Iamnitchi

摘要:真实的社会网络数据集为理解信息传播或网络演化等现象提供了重要的好处。然而,即使在剥离用户身份信息时,共享真实图数据集所带来的隐私风险也很重要。之前的研究表明,许多图匿名化技术都无法抵御现有的图去匿名化攻击。但是,这种去匿名攻击成功的具体原因还有待理解。本文系统地研究了真实图的结构特性,使它们更容易受到基于机器学习的去匿名化技术的影响。更确切地说,我们基于真实图数据集的结构属性,研究基于dK的匿名版本如何抵抗(或抵抗失败)各种类型的攻击,从而研究匿名的界限。我们的实验研究做出了三个贡献。首先,我们根据节点子集的图特征来识别攻击者的强度,从中开始去匿名攻击。其次,我们量化了dK系列图匿名化的相对有效性。第三,我们确定原始图的属性,使其更容易被去匿名化。

具有完全采用

反馈的独立级联模型下的

适应性差距影响力最大化

原文标题:

On Adaptivity Gaps of Influence Maximization under the Independent Cascade Model with Full Adoption Feedback

地址:

http://arxiv.org/abs/1907.01707

作者:

Wei Chen, Binghui Peng

摘要:在本文中,我们研究了在完全采用反馈时,独立级联模型下影响最大化问题的适应性差距。我们的主要结果是得出几个研究良好的影响图家族的上界,包括arborescences, out-arborescences和二分图。特别是,我们证明了树内的适应性差距在 集智 之间,而对于out-arborescences部分,差距是介于 集智 之间。这些是全采用反馈模型中的第一个常数上限。我们提供了一些新颖的想法来解决自适应随机优化中出现的相关反馈,我们认为这些反馈具有独立的利益。

捷克电网异常

与地磁活动相关性的统计分析

原文标题:

Statistical Analysis of the Correlation between Anomalies in the Czech Electric Power Grid and Geomagnetic Activity

地址:

http://arxiv.org/abs/1907.01753

作者:

Tatiana Výbošťoková (1), Michal Švanda (1 and 2) ((1) Astronomical Institute, Charles University, Prague, Czech Republic (2) Astronomical Institute, Academy of Sciences of the Czech Republic, Ondrejov, Czech Republic)

摘要:太阳上的爆发事件对地球的周围环境产生了影响。通过感应电流,它们还影响诸如电力传输网络的地球结构。受近期研究的启发,我们研究了捷克电力分销商维护日志中12年记录的干扰与K指数代表的它们与地磁活动之间的相关性。我们发现,如果数据集记录了高电压和非常高电压等级的电力线干扰以及变电站的干扰,那么在地磁活动最大值周围数十天的时间内,异常率在最大值和相邻活动中的最小值相比有统计上的显著增加。有迹象表明,扰动在最大值之后不久比活动最大值之前不久更明显。我们的研究结果提供了间接证据,表明即使在欧洲中部的中纬度国家,地磁感应电流也可能影响电网设备上记录的异常现象。我们需要进行一项后续研究,包括对地磁感应电流的建模,以证实我们的研究结果。

无标度优先连接模型中的加权距离

原文标题:

Weighted distances in scale-free preferential attachment models

地址:

http://arxiv.org/abs/1907.01907

作者:

Joost Jorritsma, Júlia Komjáthy

摘要:我们研究了三个优先连接模型,其中一个顶点具有固定的输出端数,另一个是输出端数可变的。我们选择参数使得输出端数遵循幂律,参数τ∈(2,3)。一旦创建了 t节点上的图,每个边都配备了一个非负独立同分布权重。我们研究了随机均匀选择的两个顶点之间的加权距离,称为典型加权距离,以及该路径上的边数,即典型跳数。我们证明了正好有两种普遍性的权重分布,称为爆炸性和保守性。在爆炸性类中,我们表明典型的加权距离在分布上收敛到两个有限随机变量。在保守类中,我们证明典型的加权距离倾向于无穷大,我们给出了主要增长项以及跳数的明确表达式。对于三种模型中的两种,我们证明在主要项下的波动在重量分布的温和额外条件下是紧的。作为推论,我们证明了具有固定输出端数的模型中主要项的典型图距离紧密性。

来源:网络科学研究速递

审校:刘培源

编辑:张爽

声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。

近期网络科学论文速递

网络流行病模型分析 等10篇

语义神经网络预测科研趋势等12篇赢者通吃——如何赢得网络全球化 等10篇

学术生涯早期与顶尖科学家合作可获得职业竞争优势 等24篇

加入集智,一起复杂!


集智

集智俱乐部QQ群|877391004

商务合作及投稿转载|swarma@swarma.org

搜索公众号:集智俱乐部

加入“没有围墙的研究所”

集智

让苹果砸得更猛烈些吧!

原文始发于微信公众号(集智俱乐部):集智