集智

心速递

  • 一点点知识是危险的:过度自信解释了对科学的消极态度;

  • GEVR:针对手机用户群的活动场所推荐系统;

  • 生物医学领域科学与技术联动演变分析;

  • 通过筛选相关矩阵构建网络:零模型方法;

  • 利用动力学的网络重构与社区检测;

  • 不只是抑郁:Reddit 的双向障碍预测;

  • 为什么理解多元社会网络结构化过程将有助于我们更好地理解人类行为的演变;

  • Airbnb 对伦敦住房结构的破坏;

  • 窥探推文地理位置隐私:一种基于图卷积神经网络的方法;

  • 完全同构的网络;

  • 活动驱动网络的突发性和流行病阈值;

  • 感知加密货币新闻的社交媒体信号;

  • 回声室内部和之间的词汇汇聚;

  • 网络驱动的经济中通过邻居属性实现混合价格歧视;

  • 信息融合评估城市密集街区的抗灾能力;

  • 从早期采用者角色手中到虚拟垃圾场:虚拟商品寿命生存分析;

  • 具有逆火效应和偏差同化的意见动力学;

一点点知识是危险的:过度

自信解释了对科学的消极态度

原文标题:

A little knowledge is a dangerous thing: excess confidence explains negative attitudes towards science

地址:

http://arxiv.org/abs/1903.11193

作者:

Frederico Francisco, Joana Gonçalves-Sá

摘要: 科学知识已被接受为发展的主要动力,允许更长寿,更健康,更舒适的生活。尽管如此,公众对科学研究的支持仍在摇摆不定,大量人们对科学不感兴趣甚至敌视。从反疫苗接种社区到最近的“后真相”运动,这都产生了严重的社会后果。对科学的这种缺乏信任和欣赏首先被证明是缺乏知识,导致了“赤字模型”。由于科学信息的增加并不一定导致更大的升值,这种模式在很大程度上被拒绝,从而产生了“公众参与模式”。

这些试图在专家和公众之间提供更加细致,双向的沟通渠道,强烈尊重非专业知识,甚至可能导致科学价值低估。因此,我们仍然缺乏一种能够解释公众对科学理解的理论,允许更有针对性和知情的方法。在这里,我们使用来自34个国家超过25年的科学和技术欧洲晴雨表调查的大型数据集,并找到证据表明信心和知识的结合是对科学态度的良好预测。

这与目前的观点相反,即将知识置于次要因素,并与行为心理学中的发现,特别是邓宁 – 克鲁格效应一致,因为消极态度在知识的中间水平达到峰值,而信心最大。我们提出了一个基于 Deficit 和 Dunning-Kruger 模型叠加的新模型,并讨论了它如何为科学传播提供信息。

GEVR:针对手机用

户群的活动场所推荐系统

原文标题:

GEVR: An Event Venue Recommendation System for Groups of Mobile Users

地址:

http://arxiv.org/abs/1903.10512

作者:

Jason Shuo Zhang, Mike Gartrell, Richard Han, Qin Lv, Shivakant Mishra

摘要: 在本文中,我们提出 GEVR ,这是第一个集体活动场地推荐系统,它将通过个人位置跟踪和上下文信息的移动性整合到“基于社交”的群体决策模型中,为移动用户群提供场地建议。我们的研究利用使用 OutWithFriendz 移动应用程序收集的真实数据集进行群组活动策划,其中包含625个用户和500多个群组活动。我们首先开发了一种新颖的“基于社会的”群体位置预测模型,该模型自适应地将不同的群体决策策略应用于具有不同社会关系强度的群体,以聚合每个群体成员的位置偏好,以预测群体将在何处会面。

评估结果表明,我们的预测模型不仅优于常用的和最先进的群体决策策略,预测群体的最终会议地点群集的准确率超过80%,而且在冷启动场景中也提供了有希望的品质。然后,我们将我们的预测模型与 Foursquare Venue Recommendation API 集成,为移动用户组构建一个事件场所推荐框架。评估结果表明,GEVR 的表现优于对比模型。

生物医学领域科学

与技术联动演变分析

原文标题:

An analysis of the evolution of science-technology linkage in biomedicine

地址:

http://arxiv.org/abs/1903.10610

作者:

Qing Ke

摘要: 证明公共研究的实用价值一直是科学政策的重要课题。在这里,我们提出了一个详细的研究,研究生命科学相关专利和生物医学研究之间37年的引文联系的演变。我们的分析依赖于新创建的数据集,该数据集系统地将数百万个非专利参考文献链接到生物医学论文。

我们发现技术部门之间科学联系的数量存在巨大差异,生物技术和药物专利占主导地位。这种联系在很长一段时间内呈指数增长,每2.9年翻一番。多年来,美国一直是引用科学的最大生产国,接受了近一半的引用。超过一半的引用归大学所有,引用的论文很可能是基础研究。美国国立卫生研究院仍然是引用科学的主要资助者。对于大多数公司而言,其专利中超过一半的引用是由公共研究撰写的。总之,这些结果表明公共科学对私营部门发明的不断贡献。

通过筛选相关矩阵

构建网络:零模型方法

原文标题:

Constructing networks by filtering correlation matrices: A null model approach

地址:

http://arxiv.org/abs/1903.10805

作者:

Sadamori Kojaku, Naoki Masuda

摘要: 网络分析已应用于各种相关矩阵数据。对成对相关值的阈值处理可能是从相关矩阵创建网络的最直接和最常用的方法。然而,有人对这种阈值方法提出了批评,例如无法过滤掉虚假的相关性,这导致提出了克服一些问题的替代方法。我们提出了一种基于正则化优化的相关矩阵创建网络的方法,其中我们在每对节点之间设置边,当且仅当边是空模型的意外时。

所提出的算法的优点在于它可以与不同类型的空模型组合。此外,该算法可以使用模型选择标准从一组候选空模型中选择最可信的零模型。对于三个经济数据集,我们发现相关矩阵的配置模型通常优于标准零模型。对于国家级产品出口数据,本方法更好地预测从国家出口的主要产品,而不是样本相关矩阵。

利用动力学网络

重构与社区检测

原文标题:

Network reconstruction and community detection from dynamics

地址:

http://arxiv.org/abs/1903.10833

作者:

Tiago P. Peixoto

摘要: 我们提出了一种可扩展的非参数贝叶斯方法,用于根据观察到的功能行为进行网络重建,同时推断出网络中存在的社区。我们表明,社区检测的联合重建具有协同效应,其中用于告知社区存在的边相关性本质上也用于提高重建的准确性,这反过来可以更好地为社区的发现提供信息。我们用合成和经验网络以及仅包含功能信息的数据来说明我们的方法与流行病模型和伊辛模型的观察结果的使用。

不只是抑郁:

Reddit的双向障碍预测

原文标题:

Not Just Depressed: Bipolar Disorder Prediction on Reddit

地址:

http://arxiv.org/abs/1811.04655

作者:

Ivan Sekulić, Matej Gjurković, Jan Šnajder

摘要: 双相情感障碍是一种以躁狂和抑郁发作为特征的疾病,影响全世界超过6000万人。我们根据用户生成的 Reddit 文本提出了双相情感障碍预测的初步研究,该文本依赖于用户的自我报告标签。我们用于双相情感障碍预测的基准分类器优于基线并达到准确度,F1 分数高于86%。特征分析显示双相障碍患者和对照组之间语言使用的有趣差异,包括情绪表达词语的使用差异。

为什么理解多元社会网络

结构化过程将有助于我们

更好地理解人类行为的演变

原文标题:

Why understanding multiplex social network structuring processes will help us better understand the evolution of human behavior

地址:

http://arxiv.org/abs/1903.11183

作者:

Curtis Atkisson, Piotr J. Górski, Matthew O. Jackson, Janusz A. Hołyst, Raissa M. D’Souza

摘要: 人类学家长期以来一直认为,单层网络对人类交互的描述不够 – 个体嵌入到具有依赖性的复杂网络中。关于这一点的一个辩论围绕着食物分享。一些人认为,未能找到互惠的食物分享意味着必须发生除互惠之外的某些过程,而其他人认为允许互惠跨越领域的模型。

多维社会网络的分析最近引起了数学和物理界的关注。多层网络无处不在并产生后果,因此产生这些网络的过程是重要的社会现象。这些过程的最新模型显示了忽略层相互依赖性如何导致人们错过为什么一个层形成它的方式,和/或得出错误的结论。了解作为多路复用网络基础的结构化过程将有助于理解越来越丰富的数据集,这些数据集可以提供更好,更丰富,更准确的社交互动图片。

Airbnb对伦敦住房结构的破坏

原文标题:

Airbnb’s disruption of the housing structure in London

地址:

http://arxiv.org/abs/1903.11205

作者:

Zahratu Shabrina, Elsa Arcaute, Michael Batty

摘要: 本文探讨了 Airbnb ,这是一个短期租赁住房的点对点平台,利用伦敦的数据检查这些机构的地理格局。我们的目的是分析住宅类型的多样性和各种社会经济属性是否与列表的分布相关联。我们使用基于熵的传播度量来指示住宅类型的多样性,并使用相关性分析查看其与 Airbnb 机构分布的关系,以及该区域的人口统计,社会和经济概况。

值得注意的是,我们的研究仅考虑国内建筑类型,并排除有关土地利用多样性的任何信息。我们的分析得出了两个重要的发现。首先,Airbnb 租赁的空间位置与住宅类型的多样性呈负相关,与单一住宅类型正相关,这通常与商业建筑中的特制公寓,转换和公寓相对应。

其次,Airbnb 与私人租赁物业比例较高的地区有关,将超过1.4%的住房供应减少为短期租金。在某些街区,这种现象可能达到20%,进一步加剧了高档化的过程。最后,我们讨论了这些调查结果的含义,作为与“共享”经济相关的政策与房屋结构中断相关的政策。

窥探推文地理位置隐私:

一种基于图卷积神经网络的方法

原文标题:

Infringement of Tweets Geo-Location Privacy: an approach based on Graph Convolutional Neural Networks

地址:

http://arxiv.org/abs/1903.11206

作者:

Luca Luceri, Davide Andreoletti, Silvia Giordano

摘要: 在线社会网络(OSN)获得的巨大受欢迎程度引发了对社交媒体平台中用户隐私的自然担忧。虽然 OSN 中的用户可以通过故意决定分享什么来调整他们的隐私,但是与社会网络内的其他个人的交互可以暴露并最终公开敏感信息。在所有可共享的个人数据中,地理位置特别有趣。

一方面,用户倾向于将他们当前的位置视为非常敏感的信息,避免在大多数时间共享它。另一方面,服务提供商有兴趣提取和利用地理标记数据以提供定制服务。在这项工作中,我们考虑仅利用 OSN 中其他社交联系人的可用信息来推断用户的当前位置的问题。为此,我们采用基于图的深度学习架构,在一段考虑的时间内学习用户已知和未知地理位置之间的模型。

作为一个研究案例,我们认为 Twitter ,用户生成的内容(即推文)可以嵌入用户的当前位置。我们的实验验证了我们的方法,并进一步确认了与 OSN 中数据隐私相关的问题。结果表明存在临界质量现象,即,如果至少10%的用户向他们的推文提供地理标签,则所有剩余用户的隐私严重受到威胁。事实上,我们的方法能够将近50%的推文本地化,精确度低于1公里,仅依赖于一小部分可用信息。

完全同构的网络

原文标题:

Totally Homogeneous Networks

地址:

http://arxiv.org/abs/1903.11289

作者:

Dinghua Shi, Linyuan Lü, Guanrong Chen

摘要: 在网络科学中,节点度的非同质性一直是研究的关注问题。然而,利用当今的现代 Web 技术,传统的社交通信拓扑已经从节点中心结构演变为基于在线循环的社区,迫切需要新的网络理论和工具。将焦点从节点度转换为网络周期,它可以从完全同质的网络或复杂网络中的子网络的角度揭示许多有趣的属性,尤其是诸如链接和三角形之类的基本单形(集团)。

显然,与节点度相比,处理网络周期更具挑战性。为了研究后者,本文引入了一个新的集团向量空间框架,其中带有由链接组成的基础的向量空间的维数等于链接的数量,具有由三角形组成的基础的维度等于三角形的数量,等等。这两个向量空间通过边界算子相关,例如,将一个空间中的三角形的边界映射到另一个空间中的三个链接的太阳。

在新框架下,代数拓扑的一些重要概念和方法,如特征数,同源群和贝蒂数,将在网络科学中发挥作用,从而产生可预见的新研究方向。作为直接应用,本文阐述了影响复杂网络集体行为的一些重要特征,一些新的循环依赖的节点重要性指标,以及对网络同步和脑网络分析的影响。

活动驱动网络的突

发性和流行病阈值

原文标题:

Burstiness in activity-driven networks and the epidemic threshold

地址:

http://arxiv.org/abs/1903.11308

作者:

Marco Mancastroppa, Alessandro Vezzani, Miguel A. Muñoz, Raffaella Burioni

摘要: 我们研究了异质时间激活对时间网络中流行病传播的影响。我们关注具有突发性的活动驱动网络上的易感染易感(SIS)模型。通过使用基于活动的平均场方法,我们得出一个封闭的分析形式,用于任意活动和事件间时间分布的流行阈值。

我们表明,正如预期的那样,突发性降低了流行阈值,而其对流行的影响是双重的。在低感染系统中,突发性提高了平均感染概率,同时它减弱了高传染性的流行病蔓延。我们的结果可以帮助澄清文献中报道的突发性的冲突效应。我们还讨论了转换时的尺度属性,表明它们不受突发性影响。

感知加密货币新

闻的社交媒体信号

原文标题:

Sensing Social Media Signals for Cryptocurrency News

地址:

http://arxiv.org/abs/1903.11451

作者:

Johannes Beck, Roberta Huang, David Lindner, Tian Guo, Ce Zhang, Dirk Helbing, Nino Antulov-Fantulin

摘要: 实时跟踪和监控相关重要新闻的能力对多个工业部门至关重要。在这项工作中,我们专注于加密货币新闻集,最近成为普通和金融受众的新兴趣。为了实时跟踪相关新闻,我们(i)将来自网络的新闻与社交媒体的推文进行匹配,(ii)跟踪他们的日内推文活动,以及(iii)探索不同的机器学习模型以预测文章的数量在 Twitter 发布后的前24小时内在 Twitter 上提及。我们比较了几种机器学习模型,如线性外推,线性和随机森林自回归模型,以及序列到序列神经网络。我们发现随机森林自回归模型在大多数任务中表现得与更复杂的模型相当。

回声室内部和之间的词汇汇聚

原文标题:

Lexical convergence inside and across echo chambers

地址:

http://arxiv.org/abs/1903.11452

作者:

Emanuele Brugnoli, Matteo Cinelli, Fabiana Zollo, Walter Quattrociocchi, Antonio Scala

摘要: 最近针对 Facebook 的研究显示,用户倾向于与信息互动,坚持他们喜欢的叙述,并忽略不同的信息。确认偏差似乎考虑了用户关于消费和传播内容的决定,同时,在志同道合的人群(回声室)内聚集有利信息会加强选择性曝光和群体极化。为了更深入地了解这些集群社区的观点,我们在这项工作中分析了围绕两个截然不同且相互冲突的叙述 – 即科学与阴谋新闻 – 在 Facebook 上出现的回声室的用户语言。尽管这些社区的隔离程度很高,但我们表明来自两个回声室的用户采用非常相似的词汇表,并且在他们的评论活动中使用相同的词,在个人和集体层面上使用相同的词。

此外,在会话级别放大,我们观察到用户之间的词汇融合的出现,这些用户通过共同评论活动不仅在内部,而且在回声室之间进行共同评论。因此,即使具有相反观点的用户在加入讨论时逐渐协调其语言行为,也表明用户总是希望在参与对话时实现通信。

网络驱动的经济中通过

邻居属性实现混合价格歧视

原文标题:

Towards hybrid price discrimination via neighbours properties in network-driven economy

地址:

http://arxiv.org/abs/1903.11469

作者:

Jacopo Arpetti, Antonio Iovanella

摘要: 数据收集能力的提高以及数据分析技术的普及,使得少数看门人手中的个人偏好信息空前集中。在这种背景下,传统的经济文献一直试图构建所有数据驱动的经济特征。这些特征虽然能够实现人员和相关购买机会的更有效匹配,但也会导致扭曲和不平衡,直至市场失灵。

数据经济市场不平衡可以通过利用一些已知的网络属性来解密,从而获得适合于建立经济现象的新理论框架的一般结果。从数字公司可以始终从消费者的基础网络或与其市场相关的项目中获益的假设开始,他们的代表性确实可以提供显著的竞争优势,同时通过增强的能力来提高平台实施歧视性做法的能力。估计个人的偏好。

在本文中,我们提出了一种称为信息保护的措施,考虑系统内可用的信息量,我们研究平台如何利用源自网络内连接配置文件的数据,以期获得竞争优势。这样的信息流可能最终允许设想出现新的混合价格歧视模式,平台可以通过该模式影响和引导个人的购买选择,以及向不同的客户应用不同的价格。

信息融合评估城市

密集街区的抗灾能力

原文标题:

Information Fusion to Estimate Resilience of Dense Urban Neighborhoods

地址:

http://arxiv.org/abs/1903.11478

作者:

Anthony Palladino, Elisa J. Bienenstock, Bradley M. West, Jake R. Nelson, Tony H. Grubesic

摘要: 在快速增长的密集城市地区,不同的社会文化影响可能会对公务员造成压力,并降低这些地区对外生和内生冲击的抵御能力。我们提出了一种新的计算机和社会科学基础方法,与最先进的技术相比,可以在更精细的时空尺度上估算密集城区的复原力。我们融合多模态数据源来估计社会科学理论的弹性指标,并利用结构化本体来进行因子组合,以提高可解释性。对破坏稳定地区的估计可以通过确定需要增加社会服务的关键领域来提高民政政府的决策能力。

从早期采用者角色手中到虚拟

垃圾场:虚拟商品寿命生存分析

原文标题:

From the Hands of an Early Adopter’s Avatar to Virtual Junkyards: Analysis of Virtual Goods’ Lifetime Survival

地址:

http://arxiv.org/abs/1903.11506

作者:

Kamil Bortko, Patryk Pazura, Juho Hamari, Piotr Bartków, Jarosław Jankowski

摘要: 经济学,物流学和商业预测研究中的一个主要问题是以商品的形式衡量和预测价值创造,分配和生命。在“真正的”经济中,商品流通的完美模式是不可能的。然而,虚拟现实和经济为广泛的经济学研究提供了新的前沿,因为可以准确地跟踪每种商品和交易。

因此,预测货物流通的模型可以在引入“现实生活”和其他情景之前进行测试和确认。本研究的重点是早期虚拟商品采用者的特征,以及他们如何预测商品的寿命。我们使用机器学习和决策树作为我们预测模型的基础。结果提供证据表明,仅基于来自这些对象的早期持有者的数据,可以预测虚拟对象的寿命。总体而言,沟通和社交活动是有效传播虚拟商品的主要动力,并且它们是早期采用者最期望的特征。

具有逆火效应和偏

差同化的意见动力学

原文标题:

Opinion Dynamics with Backfire Effect and Biased Assimilation

地址:

http://arxiv.org/abs/1903.11535

作者:

Xi Chen, Panayiotis Tsaparas, Jefrey Lijffijt, Tijl De Bie

摘要: 用于内容生成的 AI 工具的民主化,以及对所有人不受限制地访问大众媒体(例如通过微博和社交媒体),使得人们越来越难以区分事实和虚构。这提出了一个问题,即在没有基于已知现实的基础的情况下,个人意见如何在这样的网络环境中发展。研究这个问题的主要方法是使用社会科学中的简单模型,了解个人在接触社交社区时如何改变他们的观点,并将其应用于大型社会网络。

我们提出了一个新颖的模型,其中包含两个已知的社会现象:(i)偏差同化:个体倾向于采用其他意见,如果他们与他们自己相似; (ii)逆火效应:相反的意见可能进一步巩固某人的立场,使他们的观点更加极端而不是缓和它。据我们所知,这是第一个捕捉逆火效果的模型。对所提出的模型进行彻底的理论和实证分析,揭示了存在极化和共识的直观条件,以及由此产生的观点的属性。

来源:网络科学研究速递

编辑:孟婕

声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。

近期网络科学论文速递

社区检测的精确“没有免费午餐”定理 等14篇

用于维基百科研究的图结构数据集 等10篇

新型异构图注意网络 等24篇

利用数据科学了解电影业的性别差距 等8篇

无标度特性促进脑网络交叉频率相互作用 等19篇

加入集智,一起复杂!


集智

集智俱乐部QQ群|877391004

商务合作及投稿转载|swarma@swarma.org

搜索公众号:集智俱乐部

加入“没有围墙的研究所”

集智

让苹果砸得更猛烈些吧!

原文始发于微信公众号(集智俱乐部):集智