集智

心速递

  • 图上的端到端学习和优化;

  • 使用多个指标改进图中隐私的度量;

  • 我们能从语料库中得出明显和隐含的偏见吗?;

  • 通过在手机众感拍卖中惩罚冗余任务分配来最大化出清率;

  • 发现客户评价中在线欺诈群体的串通行为;

图上的端到端学习和优化

原文标题:

End to end learning and optimization on graphs

地址:

http://arxiv.org/abs/1905.13732

作者:

Bryan Wilder, Eric Ewing, Bistra Dilkina, Milind Tambe

摘要: 实际应用程序通常将学习和优化问题结合在一起。例如,我们的目标可能是聚类图以便检测有意义的社区(或解决其他常见的图优化问题,例如设施位置,最大限度等)。然而,通常仅部分地观察图或相关属性,引入学习问题,例如必须在优化之前解决的链路预测。

我们提出了一种方法,将用于常见图优化问题的可微代理集成到用于链路预测等任务的机器学习模型的训练中。这允许模型将专注于其预测将用于的下游任务。实验结果表明,我们的端到端系统在示例优化任务上获得的性能,优于通过将最先进的链路预测方法与专家设计的图优化算法相结合而获得的性能。

使用多个指标改

进图中隐私的度量

原文标题:

Using Metrics Suites to Improve the Measurement of Privacy in Graphs

地址:

http://arxiv.org/abs/1905.13264

作者:

Isabel Wagner, Yuchen Zhao

摘要: 社交图被广泛用于科研(如流行病学)和商业(如推荐系统)。但是,共享这些图表会带来隐私风险,因为它们包含有关个人的敏感信息。图匿名化技术旨在保护图中的各个用户,而图去匿名化旨在重新识别用户。通常使用隐私度量来评估匿名化和去匿名化算法的有效性。但是,目前尚不清楚现有的隐私指标在图隐私中使用时的强弱程度。

在本文中,我们研究了图匿名化和去匿名化的26个隐私度量,并根据三个标准评估这些隐私度量指标的强度:单调性,均匀度,共享值范围。我们的广泛实验表明,没有一个指标可以完美地满足所有三个标准。因此,我们使用来自多标准决策分析的方法来聚合度量套件中的多个度量,并且我们显示这些度量套件与最佳单个度量相比改善了单调性。这一重要结果使得对新图匿名化和去匿名化算法的评估更加单调,从而更准确。

我们能从语料库中得

出明显和隐含的偏见吗?

原文标题:

Can We Derive Explicit and Implicit Bias from Corpus?

地址:

http://arxiv.org/abs/1905.13364

作者:

Bo Wang, Baixiang Xue, Anthony G. Greenwald

摘要: 基于“演讲者的陈述代表他们对概念的偏见”这一假设,语言是挖掘演讲者态度偏见的一种常用资源。然而,心理学研究表明,人们在陈述中的明显偏见可能与其隐含的偏见有所不同。尽管显式和隐式偏差对于不同的应用场景都是有用的,但是当前的自动技术不能区分它们。

受到显性和隐性偏见的心理测量的启发,我们开发了一种基于语言自动再现大规模人群心理测量的技术。通过将每个心理测量与包含特定单词组合的语句联系起来,通过理解相应类别语句的情感,我们得出明确和隐含的偏差。对中英文严肃媒体(维基百科)和非严肃媒体(社交媒体)的广泛实验表明,我们的方法成功地重现了对大规模人口的小规模心理观察,并取得了新的发现。

通过线上拍卖中惩罚冗余

任务分配来最大化拍卖清除率

原文标题:

Maximizing Clearance Rate by Penalizing Redundant Task Assignment in Mobile Crowdsensing Auctions

地址:

http://arxiv.org/abs/1905.13563

作者:

Maggie E. Gendy, Ahmad Al-Kabbany, Ehab F. Badran

摘要: 该研究涉及基于拍卖的任务分配和管理在集中式,参与式移动群体(MCS)系统中的有效性。在拍卖期间,基于分别由参与者和平台提供的出价和激励,将感测任务与参与者匹配。最近的文献解决了拍卖中的一些挑战,包括不真实的出价和恶意参与者。我们最近的工作开始解决另一项挑战,即在传感活动中最大化清除率(CR),即完成的传感任务的百分比。

在这项研究中,我们提出了一个新的目标函数,用于将任务与参与者匹配,以实现 CR 最大化,声誉感知的拍卖。特别是,我们惩罚冗余任务分配,其中任务被分配给多个参与者,这可以不必要地消耗预算。我们观察到,某个任务的投标人越少,应该分配的优先级就越高。因此,我们引入了一个新因素,即管理拍卖的任务冗余因素。通过在不同的传感活动条件下进行广泛的模拟,并给出固定的预算,我们表明,与最近文献中的最高清除率相比,惩罚冗余(给予不受欢迎的任务更高的优先级)会使 CR 显著增加约50%。

发现客户评价中在

线欺诈群体的串通行为

原文标题:

Spotting Collusive Behaviour of Online Fraud Groups in Customer Reviews

地址:

http://arxiv.org/abs/1905.13649

作者:

Sarthika Dhawan, Siva Charan Reddy Gangireddy, Shiv Kumar, Tanmoy Chakraborty

摘要: 在线评论在购买任何产品之前在决定质量方面起着至关重要的作用。不幸的是,垃圾邮件发送者经常利用在线评论论坛撰写欺诈评论来推广/降级某些产品。当这些垃圾邮件发送者串通并集体注入垃圾邮件评论时,它可能会变得更加有害,因为它们可以完全控制用户的情绪,因为它们 注入了大量的欺诈评论。因此,群组垃圾邮件检测比单个级别的欺诈检测更具挑战性,因为群组定义不明确,群间动态变化,标记的群组级别垃圾邮件数据稀缺等等。

在这里,我们提出 DeFrauder,用一种无监督的检测方法审查线上欺诈团伙。它首先通过利用基础产品评论图表并结合几种行为信号来检测候选欺诈群体,这些信号模拟了评论之间的多方面协作。然后,它将审阅者映射到嵌入空间,并为每个组分配垃圾邮件分数,使得包含具有高度相似行为特征的垃圾邮件发送者的组实现高垃圾邮件分数。在与四个真实世界数据集(其中两个由我们策划)的五个基线进行比较时,DeFrauder 表现出优异的性能,优于最佳基线,NDCG @ 50(平均)跨数据集高出17.64%。

来源:网络科学研究速递

编辑:孟婕

声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。

近期网络科学论文速递

探索数据集选择对衡量国际研究合作的影响 等12篇

共享汽车匹配算法如何导致司收入巨大差异 等12篇

图注意力自动编码器 等31篇

复杂网络中的嵌套性:观察、涌现和启示 等23篇

什么是社会组织的熵?等8篇

加入集智,一起复杂!


集智

集智俱乐部QQ群|877391004

商务合作及投稿转载|swarma@swarma.org

搜索公众号:集智俱乐部

加入“没有围墙的研究所”

集智

让苹果砸得更猛烈些吧!

原文始发于微信公众号(集智俱乐部):集智