为什么维基百科风靡全球,不只限于英语国家 | 网络科学论文速递17篇-集智俱乐部

核心速递:

  • 研究领域和主题的性别差异:对285个领域的出版物进行分析;

  • 枢纽在协同行为传播中的作用;

  • 化感交互网络中的社区结构:生态演化方法;

  • 反洗钱的可扩展图学习初探;

  • 从卫星图像量化经济增长的动态网络和表征学习方法;

  • 基于节点优先级的大规模二分网络蝶形计数;

  • 假新闻:研究综述,检测方法和机会;

  • 无序系统的固有不稳定性;

  • 为什么全世界会读维基百科:不只是说英语的人;

  • 美朝对话的扭曲与转折:使用新闻文章的关键人物动态网络分析;

  • 作为同步现象的公交车聚集;

  • 利用综合信息论寻找鱼群的连续性和不连续性;

  • 测试随机块模型的社区变化;

  • FTR-18:收集有关足球转会新闻的谣言;

  • 动态网络数据的分割;

  • 从用户到媒体:跨Web社区的神经网络概析;

  • 物联网机遇与挑战的公众感知纵向分析;

研究领域和主题的性别差异:

对285个领域的出版物进行分析

原文标题:

Gender differences in research areas and topics: An analysis of publications in 285 fields

地址:

http://arxiv.org/abs/1809.01255

作者:

Mike Thelwall, Carol Bailey, Catherine Tobin, Noel-Ann Bradshaw

摘要: 尽管学术界的性别差距已经缩小,但在美国的某些领域,女性的代表性不足。之前的研究表明,科学,技术,工程和数学领域之间的不平衡可能部分是由于男性对事物的兴趣增加,女性对人们的兴趣增加,或者某些学科的男性文化偏颇。为了更详细地了解所有科目,本文比较了2017年发表的第一篇作文,在26个广阔领域内的285个狭窄Scopus领域内和美国之间的男性和女性研究人员。该比较基于出版领域和使用的词语在文章标题,摘要和关键字中。人/事维度无法完全解释结果。

例外情况包括女性对兽医科学和细胞生物学的兴趣增加,以及男性对抽象,患者和权力/控制领域(如政治和法律)的兴趣增加。这可能是由于其他因素造成的,例如职业提供身份或社会影响的能力或其他职业的可用性。作为部分人/物关系的可能副作用,女性更可能使用探索性和定性方法,而男性更可能使用定量方法。结果表明,消除学术界明显和隐含的性别偏见的必要步骤是不充分的,并且可以通过使田地对少数民族性别更具吸引力的措施来补充。

枢纽在协同行为传播中的作用

原文标题:

Role of Hubs in the Synergistic Spread of Behavior

地址:

http://arxiv.org/abs/1809.11041

作者:

Yongjoo Baek, Kihong Chung, Meesoon Ha, Hawoong Jeong, Daniel Kim

摘要: 社会行为的传播有两个主要特征:多个传播者的协同作用和枢纽的主导地位。虽然已知强烈的协同作用会在渗透时引起混合有序转变(MOTs),但集线器对这些现象的影响尚未得到澄清。通过利用幂律度分布 p_k sim k ^ { - alpha} 分析解决随机无标度网络上的广义流行过程,我们阐明了社会网络中枢的主导地位如何影响MOT的条件。

我们的结果显示,对于 alpha <4 ,大量的集线器驱动MOT,即使协同传播事件需要任意大量的相邻传播者。特别是,对于 2 < alpha <3 ,我们发现即使只允许协同传播事件,也可以实现全局级联。这些过渡特性与合作传染特性大不相同,合作传染是展示MOT的另一类协同级联过程。

化感交互网络中的社区结构:

生态演化方法

原文标题:

Community structures in allelopathic interaction networks: an eco-evolutionary approach

地址:

http://arxiv.org/abs/1812.00052

作者:

Sylvestre Aureliano Carvalho, Marcelo Lobato Martins

摘要: 如今,越来越多的证据表明,生物体的种族适应其邻居合成的化学物质可能会推动社区结构。特别地,一些细菌感染和破坏本地群落的植物入侵依赖于释放抑制或杀死敏感菌株或个体来自其自身或其他物种的化感物质。在本报告中,通过数值分析提出并研究了通过资源竞争,等位基因相互作用和演化分支进行群落组装的生态演化模型。我们的主要研究结果是,生物多样性增加的稳定群落可能出现弱化感抑制,但强烈的等位基因与群落多样性呈负相关。在前一种情况下,化感相互作用网络表现出高斯度分布,而在后一种情况下,网络度是威布尔分布。

反洗钱的可扩展图学习初探

原文标题:

Scalable Graph Learning for Anti-Money Laundering: A First Look

地址:

http://arxiv.org/abs/1812.00076

作者:

Mark Weber, Jie Chen, Toyotaro Suzumura, Aldo Pareja, Tengfei Ma, Hiroki Kanezashi, Tim Kaler, Charles E. Leiserson, Tao B. Schardl

摘要: 有组织犯罪以种族灭绝的规模造成人类痛苦:墨西哥贩毒集团自2006年以来已经杀害了15万人,每年有超过70万人被“出口”在人口贩运行业,奴役估计有4 000万人。这些邪恶的行业依靠复杂的洗钱计划来运作。尽管有大量资源用于反洗钱(AML),但只有极少部分的非法活动被阻止。研究界可以提供帮助。

在这篇简短的论文中,我们绘制了驱动技术挑战的结构和行为动态。我们审查AML方法,当前和紧急。我们首先介绍可扩展图卷积神经网络,用于金融数据的取证分析,这是大规模,密集和动态的。我们使用由我们创建的名为AMLSim的数据模拟器生成的大型合成图(1M节点,9M边)报告初步实验结果。我们在计算和内存方面考虑了高性能效率的机会,并且我们分享了简单的图压缩实验的结果。我们的研究结果支持了我们的工作假设,即AML的深度学习图在打击犯罪金融活动方面具有很大的前景。

从卫星图像量化经济增长的

动态网络和表征学习方法

原文标题:

A Dynamic Network and Representation Learning Approach for Quantifying Economic Growth from Satellite Imagery

地址:

http://arxiv.org/abs/1812.00141

作者:

Jiqian Dong, Gopaljee Atulya, Kartikeya Bhardwaj, Radu Marculescu

摘要: 由于缺乏可靠的经济数据,量化人类生活水平的提高以及发展中国家的城市增长是一个具有挑战性的问题。因此,基本需要可以估计发展中地区经济状况的替代的,基本上无监督的计算方法。为此,我们提出了一种新的基于网络科学和表征学习的方法,可以量化经济指标并可视化各个地区的增长。

更准确地说,我们首先创建一个由高分辨率夜光卫星图像绘制的动态网络。然后,我们证明了使用表示学习来挖掘由此产生的网络,我们提出的方法可以准确地预测大区域的空间总体经济支出。我们的方法只需要夜间图像和有限的调查数据,可以捕捉城市增长,以及人们的生活水平如何变化;这最终可以促进决策者对增长的理解,而不会严重依赖昂贵且耗时的调查。

基于节点优先级的

大规模二分网络蝶形计数

原文标题:

Vertex Priority Based Butterfly Counting for Large-scale Bipartite Networks

地址:

http://arxiv.org/abs/1812.00283

作者:

Kai Wang, Xuemin Lin, Lu Qin, Wenjie Zhang, Ying Zhang

摘要: 在许多实际应用中,二分网络非常重要。在二分网络中,蝶形(即完全的2 x 2二元团)是最小的非平凡的内聚结构并起着关键作用。在本文中,我们研究了有效计算二分网络中蝶形数量的问题。最近研究了这个问题。最有效的现有技术基于枚举楔形,这是计算蝶形的主要成本。然而,现有算法难以处理大规模的二分网络。这成为大规模应用程序的瓶颈。

在本文中,我们提出了一种基于节点优先级的范式BFC-VP来代替现有的基于层优先级的技术来枚举更少的楔形;这导致了现有技术算法的时间复杂度的显著改善。此外,我们还提出了缓存感知策略,以进一步提高时间效率,同时理论上保留BFC-VP的时间复杂度。这些不仅解决了现有技术无法在某些真实数据集上完成的问题,而且广泛的实证研究表明,当真实数据集时,我们的技术可以将最先进的技术加速到两个数量级。现有技术可以完成。

假新闻:研究综述,

检测方法和机会

原文标题:

Fake News: A Survey of Research, Detection Methods, and Opportunities

地址:

http://arxiv.org/abs/1812.00315

作者:

Xinyi Zhou, Reza Zafarani

摘要: 假新闻的爆炸性增长及其对民主,正义和公众信任的侵蚀增加了对假新闻分析,检测和干预的需求。该调查全面系统地审查假新闻研究。该调查确定并指定了不同学科的基本理论,例如心理学和社会科学,以促进和加强假新闻的跨学科研究。目前的假新闻研究得到审查,总结和评估。

这些研究从四个方面着眼于虚假新闻:(1)它所承载的虚假知识,(2)其写作风格,(3)其传播模式,以及(4)其创作者和传播者的可信度。我们通过新闻及其传播者提供的各种可分析和可利用的信息,适应性的各种策略和框架以及适用的技术来描述每个视角。通过回顾假新闻研究中的假新闻和公开问题的特点,我们在本次调查结束时强调了一些潜在的研究任务。

无序系统的固有不稳定性

原文标题:

The Inherent Instability of Disordered Systems

地址:

http://arxiv.org/abs/1812.00450

作者:

Taeer Bar-Yam, Owen Lynch, Yaneer Bar-Yam

摘要: “多尺度必需品种法”是一种科学规律,在每个尺度上,将环境的变化与系统有效响应所必需的内部状态变化联系起来。虽然这项法律已用于描述系统在自我监管中的有效性,但失败的后果尚未形式化。在这里,我们使用此定律来考虑非结构化系统的内部动态,以及它对结构化环境的响应。我们发现,由于无法响应,完全非结构化的系统本质上不稳定于结构的形成。并且通常,任何没有超过一定规模的结构的系统都不能承受在该规模之上产生的结构。

为了描述复杂的内部动力学,我们开发了系统中多尺度变化的特征。这种表征是由噪声的香农信息论思想推动的,但考虑了结构化信息。然后,我们将我们的研究结果与政治无政府主义联系起来,表明社会需要一些组织过程,即使没有传统的政府或等级制度。我们还将我们的研究结果表述为热力学的逆第二定律;当封闭系统陷入混乱时,对结构化环境开放的系统会自发地产生秩序。

为什么全世界会读维基百科:

不只是说英语的人

原文标题:

Why the World Reads Wikipedia: Beyond English Speakers

地址:

http://arxiv.org/abs/1812.00474

作者:

Florian Lemmerich, Diego Sáez-Trumper, Robert West, Leila Zia

摘要: 作为网络的主要多语言知识源之一,维基百科每天都被全球数百万人阅读。尽管有这样的全球读者,但很少有人知道为什么用户阅读维基百科的各种语言版本。为了弥合这一差距,我们通过将对14种语言版本的维基百科读者的大规模调查与基于日志的用户活动分析相结合,进行了比较研究。

我们分三步进行。首先,我们分析调查结果,以比较维基百科用语跨语言的流行程度,发现维基百科语言在其使用方面的共性,但也存在实质性差异。其次,我们将调查回复与维基百科服务器日志中的受访者跟踪进行匹配,以表征与特定用例相关的行为模式,发现不同模式在语言版本中始终标记某些用例。第三,我们表明某些维基百科的用例在具有一定社会经济特征的国家更为常见;例如,在人类发展指数较低的国家,深入阅读维基百科文章更为常见。这些发现促进了我们对维基百科语言中读者动机和行为的理解,并对维基百科编辑和维基百科及其他Web技术开发人员产生了影响。

美朝对话的扭曲与转折:

使用文章关键人物动态网络析

原文标题:

Twists and Turns in the US-North Korea Dialogue: Key Figure Dynamic Network Analysis using News Articles

地址:

http://arxiv.org/abs/1812.00561

作者:

Sooahn Shin, Hyein Yang, Jong Hee Park

摘要: 在本文中,我们提出了一种分析2018年前两个季度美朝关系中关键人物动态网络的方法。我们的方法通过共同出现美国新闻文章关于朝鲜问题的关键人物网络。作为与领域相关的社交链接,文章中的人名。我们称一组人在同一领域反复出现(在我们的案例中关于朝鲜问题的新闻文章)“关键人物”和他们的社会网络“关键人物网络”。

我们使用贝叶斯隐马尔可夫多线性张量模型分析了美朝关系中关键人物网络的块结构变化。我们的分析结果表明,美朝关系中关键人物网络的街区结构变化预示着2018年前两个季度美朝关系中重要的改变博弈规则的时刻。

作为同步现象的公交车聚集

原文标题:

Bus bunching as a synchronisation phenomenon

地址:

http://arxiv.org/abs/1812.00609

作者:

Vee-Liem Saw, Ning Ning Chung, Wei Liang Quek, Yi En Ian Pang, Lock Yue Chew

摘要: 公交车聚集是一种长期存在的现象,不仅会降低公交系统的效率,还会妨碍公交部门按时保管公交车。我们提出了一种物理理论的公交服务于一个公共汽车站循环作为一个耦合自振荡器环,类似于Kuramoto模型。持续聚束是相位同步过程的反响,其中振荡器的相位彼此锁定。当需求超过临界阈值时,就会出现这种情况。

由于不同的人类驾驶员不同的自然速度引起的频率失谐,公共汽车也在低需求,尽管是暂时的。我们计算总线系统发生 emph {完全锁相}(完全同步)时的临界转换,并将临界转换定位到 emph {完全没有锁相}(零同步)。包含 emph {嵌合状态}的中间状态是存在部分锁相总线的集群的阶段。有趣的是,这些理论结果与大学穿梭巴士系统中的真实公交车密切相关。

利用综合信息论寻找鱼群的

连续性和不连续性

原文标题:

Finding Continuity and Discontinuity in Fish Schools via Integrated Information Theory

地址:

http://arxiv.org/abs/1812.00718

作者:

Takayuki Niizato, Kotaro Sakamoto, Yoh-ichi Mototake, Takenori Tomaru, Tomotaro Hoshika, Toshiki Fukushima

摘要: 众所周知,集体行为是不同动态的结果,有时被比作生活系统。虽然许多研究揭示了各种集体行为的动态,但它们主要关注的是集体内部的信息过程,而不是整个系统本身。例如,很少研究作为系统的两个元素和三个元素之间的定性差异。托诺尼等人。已提出综合信息论(IIT)来衡量意识程度 Phi 。

IIT假定某些分区导致的信息丢失量相当于系统中信息集成的程度。该度量不仅可用于估计意识程度,还可应用于更一般的网络系统。在这里,我们应用IIT(特别是使用PyPhi的IIT 3.0)来分析真正的鱼类学校({ it Plecoglossus altivelis})。

我们在这项研究中的假设是一个非常简单的假设:一个生命系统发展到提高其 Phi 价值。如果我们接受这个假设,IIT会发现随着组大小的变化,存在连续和不连续的属性。例如,鱼群学校的领导力为4或以上的学校;但不低于三。此外,通过测量互信息或在简单的Boids模型中没有观察到这种转变。这一结果表明,综合信息 Phi 可以揭示一些使用其他措施无法观察到的固有属性。我们还讨论了鱼识别图 - 地面关系,即决定相关ON和OFF状态的因素,可以揭示获得集体行为功能演化的各种最佳路径。

测试随机块模型的社区变化

原文标题:

Testing Changes in Communities for the Stochastic Block Model

地址:

http://arxiv.org/abs/1812.00769

作者:

Aditya Gangrade, Praveen Venkatesh, Bobak Nazer, Venkatesh Saligrama

摘要: 我们在难以进行结构恢复的情况下,在2社区,对称,随机区组模型(SBM)中引入了拟合优度问题和潜在社区结构的双样本检验问题。后一个问题可能描述如下:让 x,y 是两个潜在的社区分区。给定图表 G,H 分别根据带有分区 x,y 的SBM绘制,我们希望测试假设 x = y 对 d(x,y) ge s,给定汉明失真参数 s ll n 。

之前的工作表明,这些分区的“部分”恢复到失真 s 且消失错误概率要求信噪比( mathrm {SNR})是 gtrsim C log(n / s 。我们通过构造简单的方案证明,如果 s gg sqrt {n log n},那么即使 mathrm {SNR} = O(1),这些测试问题也可以解决。 For s = o( sqrt {n}),和常量顺序度,我们通过信息论下限显示两个测试问题都需要 mathrm {SNR} = Omega( log(n)),在这个尺度上,学习社区和比较它们的最小方案是最小的最优到恒定因子。这些结果通过模拟拟合优度和标准SBM的双样本测试以及对于具有底层SBM结构的高斯马尔可夫随机场。

FTR-18:收集有关

足球转会新闻的谣言

原文标题:

FTR-18: Collecting rumours on football transfer news

地址:

http://arxiv.org/abs/1812.00778

作者:

Danielle Caled, Mário J. Silva

摘要: 本文描述了关于创建关于足球转移新闻的多语言谣言数据集FTR-18的持续工作。体育媒体不断发表转移谣言。它们既可以损害球员或俱乐部的形象,也可以增加球员的市场价值。建议的数据集包括用英语,西班牙语和葡萄牙语撰写的转移文章。它还包括Twitter转移谣言的反应。 FTR-18适用于谣言分类任务,并允许研究体育新闻中使用的语言模式。

动态网络数据的分割

原文标题:

Segmenting Dynamic Network Data

地址:

http://arxiv.org/abs/1812.00789

作者:

Rex C. Y. Cheung, Alexander Aue, Thomas C. M. Lee

摘要: 网络和图在许多复杂系统中自然出现,通常表现出可以使用动态网络建模的动态行为。动态网络中的两个主要研究问题是(1)社区检测,其旨在寻找网络内的特定子结构,以及(2)改变点检测,其试图找到子结构改变的时间点。本文提出了一种新的方法,使用模型选择框架同时解决这两个问题,其中最小描述长度原则(MDL)被用作最小化客观标准。导出的检测算法与许多现有方法兼容,并且得到经验结果和数据分析的支持。

从用户到媒体:

跨Web社区的神经网络概析

原文标题:

From the User to the Medium: Neural Profiling Across Web Communities

地址:

http://arxiv.org/abs/1812.00912

作者:

Mohammad Akbari, Kunal Relia, Anas Elghafari, Rumi Chunara

摘要: 在线社区为个人提供了一种独特的方式,可以从类似环境中获取信息,这对于需要日常和个性化管理的健康状况至关重要。由于这些群体和主题经常有机地出现,因此需要确定所讨论主题的类型以了解其需求。同样,这些社区和其中的人可以是多种多样的,并且现有的社区检测方法尚未扩展到评估这些异质性。由于社区检测方法没有关注基于用户生成内容的文本特征之间的语义关系的社区检测,因此这一点受到限制。

因此,在这里我们开发了一种方法NeuroCom,它最佳地发现密集的用户群作为潜在空间中的社区,通过用户的已发布内容的神经表示来推断。通过嵌入单词和消息,我们展示了与其他常见的无监督学习方法相比,NeuroCom展示了改进的聚类并识别出更细微的讨论主题。

物联网机遇与挑战的

公众感知纵向分析

原文标题:

A Longitudinal Analysis of the Public Perception of the Opportunities and Challenges of the Internet of Things

地址:

http://arxiv.org/abs/1812.00959

作者:

Arkaitz Zubiaga, Rob Procter, Carsten Maple

摘要: 物联网(或物联网)实现了日常物品的网络互连,在我们生活的许多方面,从娱乐到医疗保健,越来越受欢迎。虽然物联网带来了一系列宝贵的优势和机遇,但也有许多挑战尚未解决的证据。在确保物联网的网络安全方面肯定是这种情况,并且有各种设备被黑客入侵的例子。尽管有这些证据,但人们对公众对物联网所带来的机遇和挑战的看法知之甚少。

为了推进这方面的研究,我们挖掘了社交媒体平台Twitter,以了解有关物联网的公众舆论。通过分析超过670万条推文的纵向数据集,我们揭示了公众对物联网认知的见解,将大数据分析识别为最积极的方面,而安全问题则是消极方面的主要公众关注点。我们的研究旨在强调保持物联网设备安全的重要性,并提醒制造商,至少在公众认为的情况下,这是一个尚未解决的问题。

来源:网络科学研究速递

编辑:孟婕

声明:Arxiv文章摘要版权归论文原作者所有,由complexLY进行翻译整理,未经同意请勿随意转载。本系列在微信公众号和个人博客进行同步更新:

“网络科学研究速递”(微信号netsci)

https://www.complexly.me (提供RSS订阅)

推荐阅读

小世界网络之父邓肯·瓦茨经典回顾

解读幂律与无标度网络 | 网络科学入门

无标度网络理论之父Barabási回应质疑

科学家成功绘制出完整的果蝇大脑神经网络!

优化网络结构,最大程度发挥神经网络认知潜力

推荐课程

为什么维基百科风靡全球,不只限于英语国家 | 网络科学论文速递17篇-集智俱乐部

PC端观看地址:

https://campus.swarma.org/gcou=10388


为什么维基百科风靡全球,不只限于英语国家 | 网络科学论文速递17篇-集智俱乐部

集智俱乐部QQ群|877391004

商务合作及投稿转载|swarma@swarma.org

搜索公众号:集智俱乐部

加入“没有围墙的研究所”

为什么维基百科风靡全球,不只限于英语国家 | 网络科学论文速递17篇-集智俱乐部

让苹果砸得更猛烈些吧!

原文始发于微信公众号( 集智俱乐部 ):集智