集智

核心速递

  • 学排名的纵向分析;

  • 复杂网络中社区结构的一致性;

  • 使用聚合关系数据一致地估计图统计量;

  • 符号图Corona积及其在符号网络建模中的应用;

  • SimBins——一种实时多路网络中链路预测的信息论方法;

  • 有损电网和振荡器网络中的多稳态性;

  • 动态影响力的网络社区;

  • PubMed MeSH术语之间分层网络的时间演变;

  • 具有图邻信息的模型选择;

  • 行人动力学的广义无碰撞速度模型;

  • 多问题意见模型中的意识动机偏见;

  • 桁架分解的流和批处理算法;

  • 近似单源个性化PageRank查询的有效算法;

  • 贝叶斯嵌入(BEM):通过集成知识图和行为特定网络来细化表示;

  • 在广义的年龄结构空间博弈游戏中的合作;

  • 基于中心性的复杂网络重要边的识别;

  • 复杂网络稳定性增强的带宽分配与资源调整;

  • 用于测量人类流动模式的时间稳定性的统计框架;

  • 五十年的美国、英国、德国和荷兰音乐排行榜显示文化进程正在加速发展;

  • 通过图分区实现有效的高效网络嵌入初始化;

  • 数学模拟有中间宿主的新兴人畜共患病的溢出动力学;

  • 注释的兴起与衰落:2000-2018年ACM CSCW论文长度变化;

  • 社交媒体虚假新闻检测;

1. 大学排名的纵向分析

原文标题:

A Longitudinal Analysis of University Rankings

地址:

http://arxiv.org/abs/1908.10632

作者:

Friso Selten, Cameron Neylon, Chun-Kai Huang, Paul Groth

摘要:本文对ARWU、QS全球大学排名进行了研究。通过对排名方法的描述,我们发现大学排名是稳定的,但这三个排名之间存在差异。此外,通过主成分分析和探索性因子分析,我们发现构建排名所用的变量主要衡量两个基本因素:大学声誉及其研究成果。通过将这些因素联系起来,并将各地区大学的总数与之进行对比,排名之间的差异就显而易见了。最后,我们阐述了如何从这些分析的结果可以看到,鉴于经常表达的批评排名过程。这表明,排名使用的变量可能没有捕捉到它们声称要度量的概念。这项研究为大学排名量化大学表现的模糊性提供了证据。

2. 复杂网络中社区结构的一致性

原文标题:

Consistency of community structure in complex networks

地址:

http://arxiv.org/abs/1908.09867

作者:

Maria A. Riolo, M. E. J. Newman

摘要: 网络中最广泛使用的社区检测技术,包括基于模块化,统计推断和信息论参数的方法,都通过优化测量网络分区质量的目标函数来工作。然而,有一个很好的例子可以证明,人们不应该只关注这种目标函数下的单一最优社区结构,而应该看高分结构的选择。如果这样做,人们通常会发现得到结构显出相当大的变化,并且这已被视为这些社区检测方法不可靠的证据,因为它们似乎没有给出一致答案。这里我们认为,经过仔细检查,发现的结构实际上是以某种方式保持一致的。具体来说,我们表明它们都可以从一组底层“构建块”组成,这些“构建块”通常是在同一社区中发现的网络节点组。不同的社区结构对应于块的不同排列,但块本身在很大程度上是不变的。因此,我们提出了一种信息论方法,用于发现特定网络中的构建块,并通过几个示例应用程序对其进行演示。我们的结论是,传统的社区检测并不是一些人所认为的失败,事实上它提供了对网络结构的大量洞察,尽管可能并不完全像以前想象的那样。

3. 使用聚合关系数据

一致地估计图统计量

原文标题:

Consistently estimating graph statistics using Aggregated Relational Data

地址:

http://arxiv.org/abs/1908.09881

作者:

Emily Breza, Arun G. Chandrasekhar, Tyler H. McCormick, Mengjie Pan

摘要: 聚合关系数据(称为ARD)通过询问具有特定特征的人与组之间的连接数来捕获关于社会网络的信息,而不是直接询问每对个体之间的连接。 Breza等人(即将出版)McCormick和Zheng (2015年)涉及ARD问题,通过询问包括“您知道多少具有特征X的人”这一形式的调查项目,得到完整图形的参数统计模型。在本文中,我们提出了从ARD数据中一致估计个体和图表级别统计数据的标准。

4. 符号图Corona积及其

在符号网络建模中的应用

原文标题:

Corona product of signed graphs and its application to signed network modelling

地址:

http://arxiv.org/abs/1908.10018

作者:

Bibhas Adhikari, Amrik Singh, Sandeep Kumar Yadav

摘要: Frucht和Harary在1970年介绍了双图Corana概念。本文概括了它们对双图corona积的定义,并利用Beineke引入的标记图框架介绍了双符号图corona积。我们研究了符号图corona积的结构和谱特性。此外,我们通过迭代地考虑固定符号小图corona积来定义有符号corona图,并将小图称为相应corona图的种子图。因此有符号corona图可以用作大型增长符号网络的网络生成模型。我们研究corona图的结构属性,包括有符号链接的统计,所有类型的有符号三元组和度数分布。再次,我们还分析了由特殊结构种子图生成的带符号corona图的代数冲突。最后,我们表明适当选择种子图可以产生corona图,保留真实符号网络的属性。

5. SimBins——一种实时多路

网络中链路预测的信息论方法

原文标题:

SimBins — An Information-Theoretic Approach to Link Prediction in Real Multiplex Networks

地址:

http://arxiv.org/abs/1908.10053

作者:

Seyed Hossein Jafari, Amir Mahdi Abdolhosseini-Qomi, Maseud Rahgozar, Masoud Asadpour, Naser Yazdani

摘要: 事实证明,网络科学在理解复杂系统方面非常成功。近年来,对由多种类型关系组成的系统研究,即多路网络,已经为这些系统的动态提供了更高分辨率的细节。链路预测从节点对之间的关联角度将网络置于显微镜下。尽管单层网络中的链路预测具有很长的历史,但是在多路网络中同类工作并不多。在本研究中讨论的问题是,多路网络中的跨层相关性如何用于增强对缺失链路的预测。结果表明,在广泛的现实世界多路网络中,从社会到生物和技术,一层连接概率与其他层相似性之间存在正相关关系。随后,设计了基于相似性的自动通用多路链路预测方法-SimBins,对于多路网络的任意层,通过信息理论技术使用来推导自层本身和附加辅助层的结构特征。应用于来自不同环境的各种数据集,SimBins在链路预测的准确性方面证明比大多数实验案例中的比较方法更强大且更优越。此外,讨论了SimBins对基本相似性度量计算量较小,使其成为一种适用于大规模多路网络的潜在快速方法。

6. 有损电网和振荡

器网络中的多稳态性

原文标题:

Multistability in lossy power grids and oscillator networks

地址:

http://arxiv.org/abs/1908.10054

作者:

Chiara Balestra, Franz Kaiser, Debsankha Manik, Dirk Witthaut

摘要: 电网的稳定运行依赖于所有发电机和机器的精确同步状态。所有机器以固定的相位差以完全相同的频率旋转,从而在整个电网中产生稳定的功率流。对于给定网络是否存在这种稳定状态具有显著的实际重要性。失去稳定状态通常会导致停电直至完全停电。但是多个稳态的存在也是不可取的,因为它可能导致突然转换,循环流动并最终导致断电。稳态通常以数字方式计算,但这种方法仅对有限稳态的存在和(非)唯一性提供了有限的见解。分析结果仅适用于特殊网络配置,特别是对具有可忽略欧姆损耗的网络或没有任何环路的径向网络。在本文中,我们介绍了一种在存在欧姆损耗的情况下系统地构建实际功率负载流方程解的方法。我们明确地计算了基本网络的稳态,展示了导致多稳态的不同机制。我们的结果也适用于耦合振荡器模型,这些模型广泛用于理论物理和数学生物学。

7. 动态影响力的网络社区

原文标题:

Network Communities of Dynamical Influence

地址:

http://arxiv.org/abs/1908.10129

作者:

Ruaridh Clark, Giuliano Punzo, Malcolm Macdonald

摘要: 在对更大连接度的渴望推动下,网络系统现在以前所未有的水平渗透到我们的社会,并将以我们尚未理解的方式影响它。相比之下,大自然已经开发出高效且富有弹性的大规模网络,包括脑连接组和鸟群。这些自然系统依赖于关键要素的刺激,这些要素可以获得有效的交流途径,从而激发反应和共识。在本文中,我们探讨网络结构和动态影响之间的联系,以进一步了解这些有效的网络。我们的技术通过调查系统主要特征向量之间的关系,识别快速推动网络达成共识的关键顶点,以及在其动态影响下形成的社区。这些受到动态影响的社区能够从人类受试者的大脑连接体中清晰地识别影响,并提供对功能活动的洞察力。它们也被用来强调椋鸟群的有效性,其中增加输出度可能会产生反应较弱的群体,在观察捕食者位置上很差的鸟类最有影响力,因此策动了逃避策略。

8. PubMed MeSH术语

之间分层网络的时间演变

原文标题:

Time evolution of the hierarchical networks between PubMed MeSH terms

地址:

http://arxiv.org/abs/1908.10214

作者:

Sámuel G. Balogh, Dániel Zagyva, Péter Pollner, Gergely Palla

摘要: 分层组织是出现在自然和社会中的许多复杂网络的普遍特征。一个有趣但研究较少的问题是分层网络如何随着时间推移而演变在这里,我们采用数据驱动的方法,检查国家生物技术信息中心(NCBI,美国国家医学图书馆的一部分)提供的医学主题标题(MeSH)之间网络的时间演变。 MeSH术语之间的网络被组织成16个不同的每年更新的层次结构,例如“解剖学”,“疾病”,“化学品和药物”等。这些层次结构的自然表示由有向无环图给出,指向链接组成从层次结构中较高的节点到较低级别的节点组成。由于每年更新,这些网络的结构不断演变:可以出现新的MeSH术语,可以删除过时的术语或者与其他术语合并,并且可以重新连接网络的现有部分。我们研究了时间演变的各种统计特性,特别关注链接的附着和分离机制,并找到一些特征适用于所有MeSH层次结构的特征。研究结果表明,多个不同拓扑和分层结构的非均匀偏好之间有趣的相互作用。

9. 具有图邻信息的模型选择

原文标题:

Model Selection With Graphical Neighbour Information

地址:

http://arxiv.org/abs/1908.10243

作者:

Robert O’Shea

摘要: 准确的模型选择是统计分析的基本要求。在图形建模的许多实际应用中,正确的模型结构识别是最终目标。标准模型验证程序(如信息论分数和交叉验证)在高维设置中表现出较差的性能。因此,为了高维高斯图模型选择,人们已经开发了诸如EBIC,StARS和RIC的专门方法。我们提出了一种新颖的模型评分标准,即图邻信息。该方法展示了高维模型选择的oracle性能,在我们的仿真中优于当前的最新技术水平。图邻信息标准具有有效的封闭形式和可计算性的额外优点,从而避免了对数据子样本的多个模型代价高昂的推论。我们提供与现有技术的分析比较的方法和基准理论模拟。

10. 行人动力学的

广义无碰撞速度模型

原文标题:

Generalized collision-free velocity model for pedestrian dynamics

地址:

http://arxiv.org/abs/1908.1 0304

作者:

Qiancheng Xu, Mohcine Chraibi, Antoine Tordeux, Jun Zhang

摘要: 无碰撞速度模型是一种微观的行人模型,尽管简单,但在行人动力学中很好地再现几种自组织现象。该模型由两个部分组成:一个方向子模型,它结合了个人所需移动方向和邻居影响,来模仿在二维空间中导航过程,以及一个本质上无碰撞的速度子模型,它根据与邻居距离控制着主体速度。本文中我们通过引入墙壁的影响因子并将距离计算扩展到基于速度的椭圆,推广了无碰撞速度模型。此外,我们还对方向子模块进行了改进,在模拟中平滑行人的方向变化;由于圆形的对称性,在原始模型中看不到这个缺点。然后,所引入改进模型减轻了向后移动,特别是在瓶颈情况下得到更准确的行人分布。我们通过比较狭窄和宽阔走廊的基本图表,模拟行人形状的影响。此外,我们通过调查具有不同出口宽度的瓶颈流量来验证我们的生成方法。

11. 多问题意见模型

中的意识动机偏见

原文标题:

Ideologically Motivated Biases in a Multiple Issues Opinion Model

地址:

http://arxiv.org/abs/1908.10450

作者:

Marcelo V. Maciel, André C. R. Martins

摘要: 据观察,通常人们对持有意见的内部一致性比合理预期总是高得多。我们研究在具有多个问题意见动态模型中,通过主体如何信任他们同伴改变意见而发现这种观察结果。将已有的贝叶斯开发持续意见的意见模型扩展到包括多个问题的连续意见模型。在原始模型中,主体往往不太信任与自己太不同的意见。我们研究了在自然形式中扩展模型的属性。我们还介绍了主体的信任可能不仅取决于某个具体问题,而且取决于对许多问题的平均意见。通过采用这种意识形态的观点,我们观察到个人意见的传播显著减少。

12. 桁架分解的流和批处理算法

原文标题:

Streaming and Batch Algorithms for Truss Decomposition

地址:

http://arxiv.org/abs/1908.10550

作者: Venkata Rohit Jakkula, George Karypis

摘要: 桁架分解是一种用于分析大型稀疏图的方法,以便更好地连续识别连通子图。由于在许多领域中底层图表随时间而变化,因此其相关桁架分解也需要更新。这项工作侧重于逐步更新现有桁架分解的问题,并做出以下三个重要贡献。首先,它提出了一种理论,可以确定添加新边时桁架分解如何改变。其次,它开发了一种有效的增量算法,该算法结合了各种优化,可在每次边缘添加后更新桁架分解。这些优化旨在减少算法探索的边数。第三,它将该算法扩展到批量更新(即在添加一组边之后需要更新桁架分解),这减少了需要执行的整体计算。我们评估此算法在实际数据集上的性能。相对于非增量算法,在具有1000万条边的图中插入边,我们的增量算法实现了超过250000倍的平均加速。此外,我们对批量更新的实验表明,我们的批处理算法始终比增量算法表现更好。

13. 近似单源个性化

PageRank查询的有效算法

原文标题:

Efficient Algorithms for Approximate Single-Source Personalized PageRank Queries

地址:

http://arxiv.org/abs/1908.10583

作者:

Sibo Wang, Renchi Yang, Runhui Wang, Xiaokui Xiao, Zhewei Wei, Wenqing Lin, Yin Yang, Nan Tang

摘要: 给定图G,源节点 s 和目标节点 t , 相对于s 的个性化PageRank(PPR)是从 s 开始的随机游走终止在 t 的概率。 PPR查询的一个重要变体是单源PPR(SSPPR),它枚举 G 中所有节点,并返回相对于给定源 s 具有最高PPR值的top- k 节点。一般而言,PPR和单源SSPPR在网络搜索和社会网络中具有尤其重要的应用,例如Twitter的Who-To-Follow推荐服务中。然而,已知在大图上PPR计算是昂贵的,并且不易索引。因此,先前解决方案要么使用不能保证结果质量的启发式算法,要么依赖于成本高昂的现代数据中心的强大计算能力。受此启发,我们提出了有效的无索引和基于索引的近似PPR处理算法,并严格保证结果质量。首先我们介绍FORA,这是一种近似的SSPPR解决方案,结合了两种现有方法Forward Push(快速但不保证质量)和Monte Carlo Random Walk(准确但缓慢)以简单但非凡的方式,产生很高的准确性和效率。此外,FORA包括一个简单有效的索引方案,以及一个有高修剪能力的top- k 选择模块。大量实验表明,所提出解决方案比其各自竞争对手更加有效。特别是在数十亿边的Twitter数据集中,FORA使用单个商品服务器在1秒内回答了前500个近似SSPPR查询。

14. 贝叶斯嵌入(BEM):

通过集成知识图和

行为特定网络来细化表示

原文标题:

Bayes EMbedding (BEM): Refining Representation by Integrating Knowledge Graphs and Behavior-specific Networks

地址:

http://arxiv.org/abs/1908.10611

作者:

Yuting Ye, Xuwu Wang, Jiangchao Yao, Kunyang Jia, Jingren Zhou, Yanghua Xiao, Hongxia Yang

摘要: 知识图和行为图的低维嵌入已被证明在从预测实体之间的未观察到的边到内容推荐等各种任务中功能非常强大。两种类型的图可以包含相同实体/节点的不同且互补的信息。然而,之前的工作集中于知识图嵌入或行为图嵌入,而很少有研究统一考虑两者。这里我们提出BEM一个贝叶斯框架,结合了来自知识图和行为图的信息。更具体地说,BEM从知识图中获取预先训练的嵌入,并通过贝叶斯生成模型将它们与来自行为图的预训练嵌入集成。 BEM能够从两侧细化嵌入,同时保留自己的拓扑结构。为了显示我们方法的优越性,我们对三个基准数据集进行了一系列实验:节点分类,链路预测,与Freebase相关两个小数据集的三元组分类,以及大规模电子商务数据集项目推荐。

15. 在广义的年龄结构

空间博弈游戏中的合作

原文标题:

Cooperation in a generalized age-structured spatial game

地址:

http://arxiv.org/abs/1908.10687

作者:

Paulo Victor Santos Souza, Rafael Silva, Chris T. Bauch, Daniel Girardi

摘要:在一群自私的个体中,合作行为的出现和流行对于进化博弈论来说仍然是一个谜,因为它与自然选择的中心思想直接冲突。因此,近年来加强了对如何促进合作的了解,即使合作与个人利益相冲突。我们研究了年龄结构进化空间博弈中合作的出现。在这款游戏中,玩家会随着时间的推移而变老,而他们在每轮游戏后收到的回报则取决于他们的年龄。我们发现,游戏结果受分配类型的强烈影响,这种分配类型根据每个玩家年龄来修改收益。结果表明,在一定条件下,合作伙伴不仅可以生存,而且可以控制种群。

16. 基于中心性的

复杂网络重要边的识别

原文标题:

Centrality-based identification of important edges in complex networks

地址:

http://arxiv.org/abs/1908.10667

作者:

Timo Bröhl, Klaus Lehnertz

摘要: 中心度是网络科学中最基本的指标之一。尽管存在大量用于测量各个顶点中心度的方法,但是现在只有少数指标来测量各个边的中心度。我们将顶点各种广泛使用的中心概念修改为边的概念,以便找到网络中哪些边在其他顶点对之间是重要的。着眼于边的重要性,我们提出了一种基于边中心度的网络分解技术来识别边缘集的层次结构,其中每个边缘集与不同的重要性级别相关联。我们使用各种范式网络模型评估这种方法的效率,并应用新概念来识别社会网络分析中的常用基准模型中重要边和重要边集,与分析癫痫大脑网络的进化类似。

17. 复杂网络稳定性增强

的带宽分配与资源调整

原文标题:

Bandwidth Allocation and Resource Adjustment for Stability Enhancement in Complex Networks

地址:

http://arxiv.org/abs/1908.10671

作者:

K. Y. Henry Tsang, K. Y. Michael Wong

摘要: 我们引入了消息传递算法和离散格林函数来阐明在优化全局成本函数中,资源波动如何决定网络中的流量波动。为了增强网络对波动的稳健性,我们开发了链路最优带宽分配和节点优化资源调整的方案。在网络总带宽固定的情况下,最佳带宽分配方法可以增加链路中的带宽,使得波动网络中的过载链路数量或过量流量最小化。类似地,最佳资源调整方法是在网络总资源变化固定不变的情况下,使网络中的过载链路数量在波动情况下最小化。其中与传统比例带宽分配或资源减少方法相比,我们发现优化带宽分配或资源调整可以大大提高网络抗波动的稳定性。最优带宽分配和资源调整方案规定的负载和电流变化是互相关联的,除了一些表现出中继效应的节点。

18. 用于测量人类流动

模式的时间稳定性的统计框架

原文标题:

A statistical framework for measuring the temporal stability of human mobility patterns

地址:

http://arxiv.org/abs/1908.09830

作者:

Zhihang Dong, Yen-Chi Chen, Adrian Dobra

摘要:尽管收集GPS位置数据的人类移动性研究日益流行,但是在当前统计文献中尚未解决确定GPS监测所需最小长度问题。本文针对这一问题,提出了通过构建基于GPS位置数据评估人员移动时间稳定性的理论框架。我们根据平均速度过程和空间观察窗口中的活动分布,定义几种测量人类时空轨迹时间动力学的方法。我们用在18个月内185个人GPS位置的数据演示了此方法的使用。结果表明,GPS监测应该比以前建议时间长得多的时间内进行。此外,我们认为GPS研究设计应考虑到人口统计学因素。

关键词:密度估计;全球定位系统(GPS);人的流动性;时空轨迹;时间动态

19. 五十年的美国、英国、

德国和荷兰音乐排行榜

显示文化进程正在加速发展

原文标题:

Five decades of US, UK, German and Dutch music charts show that cultural processes are accelerating

地址:

http://arxiv.org/abs/1908.10694

作者:

Lukas Schneider, Claudius Gros

摘要: 通过分析美国,英国,德国和荷兰音乐排行榜的时间表

我们发现,专辑寿命的演变和每周排名变化的规模,为加速文化进程提供了证据。在过去50年的大部分时间里,排名第一的专辑需要一个多月的时间才能升至榜首,而如今,一张专辑要么从一开始就名列前茅,要么根本就不是。在过去的30年里,排名靠前的专辑数量从每年大约12张增加到了大约40张。在过去的几十年里,专辑寿命的分布从对数正态分布演变为幂律分布,这是一个深刻的变化。我们提出了一种关于人类活动的信息理论方法,认为个人时间范围的相关性减弱可能是造成这一现象的原因。此外,我们发现销售和基于airplay的图表在统计上存在差异,而包含流媒体对图表多样性有负面影响。此外,我们还指出,意见动态可能不仅在文化领域加速,而且在其他领域,特别是在政治领域,它可能产生深远的影响。

20.通过图分区实现

有效的高效网络嵌入初始化

原文标题:

Effective and Efficient Network Embedding Initialization via Graph Partitioning

地址:

http://arxiv.org/abs/1908.10697

作者:

Wenqing Lin, Feng He, Faqiang Zhang, Xu Cheng, Hongyun Cai

摘要: 网络嵌入已在文献中进行了深入研究,并广泛用于各种应用,例如链路预测和节点分类。虽然以前的工作侧重于新算法设计或针对各种问题设置而定制,但对学习过程中的初始化策略的讨论往往会被忽略。在这项工作中,我们解决了网络嵌入初始化的重要问题,该问题可以显著提高算法的有效性和效率。具体来说,我们首先利用图分区技术将图分成几个不相交的子集,然后根据分区构造一个抽象图。我们通过计算抽象图上网络嵌入来获得图中每个节点的嵌入初始化,该网络比输入图小得多,然后在输入图中节点之间传播嵌入。通过对各种数据集的大量实验,我们证明了我们的初始化技术显著提高了最先进算法在链路预测和节点分类评估方面的性能,分别高达7.76%和8.74%。此外,我们表明初始化技术将现最先进技术的运行时间减少了至少20%。

21. 数学模拟有中间宿主的

新兴人畜共患病的溢出动力学

原文标题:

Mathematically Modeling Spillover Dynamics of Emerging Zoonoses with Intermediate Hosts

地址:

http://arxiv.org/abs/1908.10791

作者:

Katherine P. Royce, Feng Fu

摘要: 世界卫生组织将人畜共患疾病描述为一种主要流行病威胁,对这些疾病行为进行建模是对其控制的关键组成部分。许多新出现的人畜共患病,例如SARS,Nipah和Hendra不仅在他们的野生型中突变,同时在中间宿主群体(通常是家养物种)中传播,从而在人类中变得更容易传播。而且随着世界各地农业贸易的加剧,此传播途径只会变得更有可能。通过中间宿主可以使许多其它罕见的疾病能够更好地适应人类,因此有必要用数学流行病学模型理解这一过程,用于预防新出现的人畜共患病的流行,指导公共卫生的政策干预以及预测流行病行为。在本文中,我们通过模拟三种宿主物种(即野生水库,中间家畜和人类)内部和之间的传播动态来解释有中间宿主突变人畜共患病的溢出效应。我们计算了病原体的基本生殖速度,为人畜共患病出现动态提供了临界条件,并对容许的疾病平衡进行了稳定性分析。我们的分析结果与系统的长期模拟非常吻合。我们发现在现实中存在生物学种间传播参数的情况下,即使人畜共患疾病不能在其水库和中间宿主物种中持续存在,也可在人体中形成。我们的模型和结果可用于了解任何人畜共患病与中间宿主的动态行为,并有助于保护公众健康。

22. 注释的兴起与衰落:

2000-2018年

ACM CSCW论文长度变化

原文标题:

The Rise and Fall of the Note: Changing Paper Lengths in ACM CSCW, 2000-2018

地址:

http://arxiv.org/abs/1908.10808

作者:

R. Stuart Geiger

摘要: 在本文中,我定量研究了2000年 – 2018年ACM CSCW发表论文篇幅的各种趋势,重点关注编辑和评审政策的几个主要转变。重点是4页注释长度的上升和下降,该注释2004年作为单页提交类型引入10页双栏“全文”格式。从2004年到2012年,4页从2,500到4,000个单词的注释一直占有出版物的20-30%比例。 2013年,正式删除了最小和最大页面长度,在完整论文和注释说明之间没有正式区分。这种独特格式很快就完全消失了,这种流派与纸张长度不断上升的趋势共同发生。我讨论这些发现,因为它们与CSCW中本地关注点直接相关,围绕文体类型理论的长期理论讨论以及社会技术结构和可负担性如何影响分布式、计算机中介组织和用户生成内容平台的参与有关。对于注释长度下降和上升以及更长论文出现有很多可能解释,我将其确定为未来的工作。最后,我总结这些调查结果对CSCW社区的影响,特别是考虑到文体规范如何影响CSCW中何种奖学金和学者的兴趣,以及是否应围绕论文长度和不同类型制定新的自上而下规则或自下而上指导方针的贡献。

23. 社交媒体虚假新闻检测

原文标题:

False News Detection on Social Media

地址:

http://arxiv.org/abs/1908.10818

作者:

Juan Cao, Qiang Sheng, Peng Qi, Lei Zhong, Yanyan Wang, Xueyao Zhang

摘要: 社交媒体已成为人们消费和分享新闻的主要信息平台。然而,它也使广泛传播虚假新闻成为可能,即在社交媒体上发布已证实是虚假的新闻帖子,会对社会造成严重的负面影响。为了防止在社交媒体上进一步传播虚假新闻,我们设立了此次竞赛,以推动自动实时检测虚假新闻方法发展。具体来说,比赛包括三个子任务:虚假新闻文本检测,虚假新闻图像检测和虚假新闻多模式检测,旨在激励参与者进一步探索多种方式,用于提高检测多模态虚假新闻和合理融合内容的效率。为了更好地支持此次竞争,我们还在微博社交平台(MCG-FNeWS)上构建和宣传关于虚假新闻的多模数据存储库,以帮助评估参与者不同方法性能。

来源:网络科学研究速递

审校:郭治青

编辑:张爽

声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。

近期网络科学论文速递

借助科研资助数据库评估科学影响力 | 网络科学论文速递16篇

信息社会网络中网络拓扑推断与确认偏差 | 网络科学论文速递20篇

估计在线视频网络中的注意力流 | 网络科学论文速递19篇

从动力学角度看网络结构的不确定性 | 网络科学论文速递23篇

非正式导师在学术合作中的作用 | 网络科学论文速递21篇

加入集智,一起复杂!


集智

集智俱乐部QQ群|877391004

商务合作及投稿转载|swarma@swarma.org

搜索公众号:集智俱乐部

加入“没有围墙的研究所”

集智

让苹果砸得更猛烈些吧!

原文始发于微信公众号(集智俱乐部):集智