核心速递

两组简单公式估计不规则边界的分形维数;
使用随机游走进行动态图的高效表示学习;
社区检测中的度量标准很重要;
缓解城市汽车交通问题的关键因素;
量化和预测演艺界的成功;
不平衡和异构网络中的半监督学习;
用于符号网络图表示学习的深度网络嵌入;
网络犯罪的群体要素：类型、动态和犯罪行动;

两组简单公式估计

不规则边界的分形维数

原文标题：

Two Sets of Simple Formulae to Estimating Fractal Dimension of Irregular Boundaries

地址：

http://arxiv.org/abs/1901.01413

作者：

Yanguang Chen

摘要：复杂边界线可以通过分形维度来表征，其为诸如城市的地理系统的空间分析提供重要信息。然而，当图像数据有限时，难以系统地计算边界的分形维数。基于平方的边界维数近似估计公式在城市和生态研究中得到广泛应用。但有时，边界维度被高估了。

本文致力于利用分形思想开发一系列实用的边界维数估计公式。采用多个常规图作为参考形状，从中构建相应的几何测量关系;根据这些度量关系，导出两组分形维数估计公式来描述不规则边界。一个发现是不同的公式具有不同的优点和应用范围。在数据不足的情况下，这些公式可用于快速估计边界维数值。这些公式可用于地理学，地貌学，生态学，景观科学，尤其是城市科学的分形研究。

使用随机游走进行

动态图的高效表示学习

原文标题：

Efficient Representation Learning Using Random Walks for Dynamic graphs

地址：

http://arxiv.org/abs/1901.01346

作者：

Hooman Peiro Sajjad, Andrew Docherty, Yuriy Tyshetskiy

摘要： 图上的许多机器学习工作流程的重要部分是顶点表示学习，即，学习图中每个顶点的低维矢量表示。最近，已经证明了几种用于无监督表示学习的强大技术，以在下游任务（例如顶点分类和边预测）中提供最先进的性能。这些技术依赖于在图上执行的随机游走以捕获其结构特性。然后在向量表示空间中编码这些结构属性。然而，大多数当代表示学习方法仅适用于静态图，而真实世界图通常是动态的并且随时间变化。当图改变时，静态表示学习方法不能更新矢量表示;因此，无论图中的变化程度如何，它们都必须在图的更新静态快照上重新生成矢量表示。在这项工作中，我们提出了计算有效的顶点表示学习算法，将基于随机游走的方法扩展到动态图。

我们的算法的计算复杂性取决于变化的程度和速率（每次更新改变的边数）和图的密度。我们凭经验评估我们在真实世界数据集上的算法，以用于多类和多标签顶点分类的下游机器学习任务。结果表明，我们的算法可以在最先进的方法中获得有竞争力的结果，同时具有计算效率。

社区检测中的度量标准很重要

原文标题：

Metrics matter in community detection

地址：

http://arxiv.org/abs/1901.01354

作者：

Arya D. McCarthy, Tongfei Chen, Rachel Rudinger, David W. Matula

摘要： 我们提出了归一化互信息（NMI）的关键评估，作为社区检测的评估指标。 NMI夸大了leximin方法在弱社区中的表现：leximin在寻找琐碎的单体聚类方面是否真的胜过其他八种社区检测方法？

文献中的三个NMI改进是AMI，rrNMI和cNMI。我们在相关随机模型下显示等价性，并且为了评估社区检测，我们建议在 mathbb {M} _ { mathrm {all}} 模型（ n 节点的所有分区）下的单侧AMI。这项工作寻求（1）开始关于稳健测量的对话，以及（2）倡导不提供“免费午餐”的评估。

缓解城市汽车交

通问题的关键因素

原文标题：

Critical factors for mitigating car traffic in cities

地址：

http://arxiv.org/abs/1901.01386

作者：

Vincent Verbavatz, Marc Barthelemy

摘要： 过去几十年来，人们对城市系统中的汽车交通进行了大量研究，但其分析往往仅限于经验观察和基于主体的建模，尽管问题的重要性和紧迫性，我们对控制城市汽车使用的参数的理论认识也很差。拥塞。

在这里，我们将经济和运输成分结合到一个统计物理方法中，并提出一个简约模型，预测汽车司机的份额，汽车排放的CO_2 和平均通勤时间。我们在世界25个主要城市地区确认了这些分析预测，我们的结果表明，城市密度不是控制汽车相关数量的相关变量，而是城市面积和公共交通密度。然后，通过减少城市化面积，或者更现实地，通过改善公共交通密度或其访问，可以获得减少交通（及其影响，例如 CO_2 排放）。一般而言，增加固定区域的人口将增加 CO_2 的排放量，与普遍接受的范式形成鲜明对比，即增加密度会导致汽车交通量减少。

量化和预测演艺界的成功

原文标题：

Quantifying and predicting success in show business

地址：

http://arxiv.org/abs/1901.01392

作者：

Oliver E. Williams, Lucas Lacasa, Vito Latora

摘要： 最近对成功科学的研究表明，科学家或艺术家影响最大的作品在个人的职业生涯中随机而均匀地发生。然而，在某些艺术创作中，例如在电影和电视中表演，找工作也许是最重要的成就：成功只是谋生。通过分析大量有关电影和电视信息的在线数据库，我们能够研究那些在娱乐行业工作的人的成功。我们首先支持我们最初的主张，发现三分之二的演员是“一击奇迹”。

此外，我们发现，与以前的作品一致，活动聚集在热点条纹中，个人活跃的职业比例是不可预测的。然而，我们还发现，演艺界的生产力具有一系列独特的特征，这些特征是可预测的。我们揭示了在工作分配中存在丰富的富裕机制，并出现了Zipf法，以提高总体生产率。

我们发现，在职业生涯开始时，生产力往往是最高的，并且确实可以预测“annus mirabilis” – 演员最富有成效的一年 – 的位置。基于这些风格化的签名，我们开发了一种机器学习方法，以高达85％的准确度预测演员的星座奇迹是否已经过去，或者是否还有更好的日子。最后，我们分别对演员和演员进行了分析，并且我们揭示了这两组在不同指标上的可衡量和统计上显著的差异，从而在演艺界提供了令人信服的性别偏见证据。

不平衡和异构网

络中的半监督学习

原文标题：

Semi-supervised learning in unbalanced and heterogeneous networks

地址：

http://arxiv.org/abs/1901.01696

作者：

Ting Li, Ningchen Ying, Xianshi Yu, Bin-Yi Jing

摘要： 社区检测是网络分析的热门话题，其主要目的是在网络中进行无监督学习或聚类。最近，半监督学习越来越受到研究者的关注。

在本文中，我们提出了一种新的算法，称为加权逆拉普拉斯（WIL），用于预测部分标记网络中的标签。这个想法来自于随机游走中的第一个击球时间，它在信息传播和正则化框架中也有很好的解释。我们提出了部分标记的度校正块模型（pDCBM）来描述部分标记网络的生成。我们证明了WIL确保错误分类率为pDCBM的订单 O（ frac {1} {d}），平均度为 d = Omega（ log n），并且它可以处理更大的情况比传统的拉普拉斯方法不平衡。在大多数模拟和真实数据集中，WIL优于其他最先进的方法，尤其是在非平衡网络和异构网络中。

用于符号网络图表示

学习的深度网络嵌入

原文标题：

Deep Network Embedding for Graph Representation Learning in Signed Networks

地址：

http://arxiv.org/abs/1901.01718

作者：

Xiao Shen, Fu-Lai Chung

摘要： 网络嵌入在过去几年中引起了越来越多的关注。作为解决图挖掘问题的有效方法，网络嵌入旨在学习给定网络的每个节点的低维特征向量表示。然而，绝大多数现有网络嵌入算法仅针对无符号网络而设计，并且包含正链路和负链路的符号网络具有与未签名对应物非常不同的属性。

在本文中，我们提出了一个深度网络嵌入模型来学习符号网络的结构平衡保持的低维节点向量表示。该模型采用半监督堆叠自动编码器来重建给定符号网络的邻接连接。由于邻接连接在现实世界符号网络中是绝对积极的，我们施加更大的惩罚使得自动编码器更多地关注重建稀缺的负链接而不是丰富的正链接。

另外，为了保持有符号网络的结构平衡性，我们设计了成对约束，使得正连通节点比嵌入空间中的负连接节点更加接近。基于所提出的模型所学习的网络表示，我们在符号网络中进行链路符号预测和社区检测。在现实世界数据集中的广泛实验结果证明了所提出的模型相对于用于符号网络中的图表示学习的最先进网络嵌入算法的优越性。

网络犯罪的群体要素：

类型、动态和犯罪行动

原文标题：

The Group Element of Cybercrime: Types, Dynamics, and Criminal Operations

地址：

http://arxiv.org/abs/1901.01914

作者：

Jason R. C. Nurse, Maria Bada

摘要： 虽然网络犯罪通常可以是单独黑客追求的个人活动，但它已越来越多地成为一个团体活动，其网络遍布全球。本章从几个角度批判性地审视了网络犯罪的群体要素。它确定了网络群体 – 网络犯罪和其他 – 用于互动的平台，并将群体视为犯罪者和网络犯罪的受害者。一个关键的新奇事物是发现新的在线群体，其集体行动与犯罪行为相关。本章还分析了在线网络犯罪团体如何形成，组织和运作。它探讨了诸如信任，动机和手段等问题，并借鉴了Anonymous和LulzSec等几个尖锐的例子来说明这些论点。