集智



核心速递



  • “才华与运气”模型解释财富极端不平等的根源;

  • 复杂网络中的不确定性和因果关系;

  • 智能社交机器人揭示了用户偏好与新闻消费多样性之间的联系;

  • 随机、Ramanujan和大周长不规则图的向量着色;

  • 小说人物网络的提取与分析:综述;

  • 使用Google趋势和注意力seq2seq模型预测流感患病率;

  • 网络嵌入:压缩和学习;

  • 比特币交易网络与其价格动态之间不断演化的联系;

  • 由高频手机位置数据揭示的人类移动模式的特征;

  • 我不是我所写的:保留隐私的文本表示学习;

  • 基于流体的行走人群瓶颈分析;

  • 物联网生成的个人数据的概念性市场模型;

  • 确保技术产出可靠的成果;

  • 亚洲外汇市场的多重分形分析;

  • 分析参与预测的玩家;

  • Hahahahaha,Duuuuude,Yeeessss!:用两个参数表征可拉长单词以及错误输入和拼写错误的动力学;

  • 利用Ricci流的网络社区检测;

  • 由于链路删除导致有向网络上的传输丢失;

  • 气候变化对欧洲分散供热成本最佳组合的影响;

  • 多任务学习检测黑市推特;

  • 跨国家和学科的科学职业中性别不平等的历史比较;

  • 揭示空间约束在物理和虚拟移动性之间的差异和相似性中的作用;

  • 信仰的位置和空间:映射认知环境;

  • ICLab:全球纵向互联网审查测量平台;

  • 夏令时规定下的生活:为什么我们要在废除夏令时之前三思而后行?;





“才华与运气”模型解释

财富极端不平等的根源



原文标题: 

On the origins of extreme wealth inequality in the Talent vs Luck Model

地址:

http://arxiv.org/abs/1907.04237

作者:

Damien Challet, Alessandro Pluchino, Alessio Emanuele Biondo, Andrea Rapisarda


摘要: 我们引入了才华与运气(TvL)模型的简化版本(STvL),其中仅存在幸运事件并验证其动态规则导致与原始模型相同的非常大的财富不平等。我们还得出了一些分析近似,旨在从高斯分布中捕捉造成这种人才财富不平等的机制。在这些近似下,我们的分析能够很好地再现简化模型的数值模拟结果。另一方面,它也表明模型的复杂性在于幸运事件的随机转化为资本的增加,因此,当人口的人才异质性增加时,在TvL或STvL模型中寻找正资本,人才和运气的分配关系变得非常困难。





复杂网络中的不确定性和因果关系


原文标题:

Uncertainty and causal emergence in complex networks

地址: 

http://arxiv.org/abs/1907.03902

作者: 

Brennan Klein, Erik Hoel


摘要: 网络的连接传达有关节点之间的依赖关系的信息。我们表明,可以通过测量网络中节点和链路中的路径中包含的不确定性(和确定性)来分析这些信息。具体而言,我们从第一原则推导出一种称为有效信息的度量,并描述其在常见网络模型中的行为。具有较高有效信息的网络在节点之间的依赖关系中包含更多信息。我们展示了如何将节点的子图分组为宏节点,在增加其有效信息的同时减小网络的大小,这种现象称为因果涌现。我们发现因果关系在生物,社会,信息和技术领域的模拟和真实网络中很常见。最终,这些结果表明,可以直接评估网络中更高尺度的涌现,并且这些更高的尺度提供了一种从不确定性中创造确定性的方法。




智能社交机器人揭示了用户

偏好与新闻消费多样性之间的联系


原文标题:

Intelligent social bots uncover the link between user preference and diversity of news consumption

地址:

http://arxiv.org/abs/1907.02703

作者:

Yong Min, Tingjun Jiang, Cheng Jin, Qu Li, Xiaogang Jin


摘要: 在线社交媒体和微博平台的繁荣迅速改变了我们消费新闻和交换意见的方式。尽管各方机构付出了相当大的努力试图向用户推荐各种内容,但信息多样性的丧失和利益集团的两极化仍然是工业界和学术界的巨大挑战。在这里,我们利用良性社交机器人在微博(中国最大的微博平台)上设计一个受控实验。这些软件机器人可以表现出类似人类的行为(例如,更喜欢特定内容)并且在两个公认的社会学假设(即,同音和三元闭合)下模拟个人社会网络和新闻消费的形成。我们在微博上部署了68个机器人,每个机器人运行至少2个月,然后跟踪100到120个账户。总共,我们观察了5,318个用户并记录了大约630,000个暴露给这些机器人的消息。我们的研究结果表明,即使选择行为相同,喜欢娱乐内容的机器人也更有可能与同龄人形成极化社区,其中约80%的信息属于同一类型,这对于机器人来说是一个显著的差异更喜欢科技含量。结果表明,与两个众所周知的驱动程序(自选和预选)相比,用户偏好在限制自己访问各种内容方面发挥了更为关键的作用。此外,我们的结果揭示了特定内容与其在同一社会网络中传播的子结构之间的巧妙联系。在微博网络中,娱乐新闻倾向于单向星形子结构,而科技新闻则在双向聚类子结构上传播。这种联系可以放大用户偏好的多样性效应。该发现可能对扩散动力学研究和推荐系统设计具有重要意义。

 



随机、Ramanujan和

大周长不规则图的向量着色


原文标题: 

Vector Colorings of Random, Ramanujan, and Large-Girth Irregular Graphs

地址:

http://arxiv.org/abs/1907.02539

作者:

Jess Banks, Luca Trevisan


摘要:我们证明了有平均度d的稀疏图中,矢量色数(函数的色数的弛豫来自Lova sz theta函数)是        集智      。这符合一个长期存在的猜想,即关于Erdős-Rényi 的 k-着色问题的各种反驳和假设检验问题在“Kesten-Stigum阈值”之下变得难以计算。        集智       。在此过程中,我们使用着名的Ihara-Bass恒等式和精心构造的非回溯随机游走来证明独立兴趣的两个确定性的命题:使用谱的矢量色数(以及色数)的下限。非回溯步行矩阵的上限仅依赖于周长和通用覆盖。我们的上界可以等价地看作是对不规则图的Alon-Boppana定理的推广。



小说人物网络的

提取与分析:综述


原文标题: 

Extraction and Analysis of Fictional Character Networks: A Survey

地址:

http://arxiv.org/abs/1907.02704

作者:

Vincent Labatut (LIA), Xavier Bost (LIA)


摘要: 角色网络是从叙述中提取的图,其中顶点表示角色,边对应于它们之间的交互。通过对角色网络的分析,例如摘要,分类或角色检测,可以自动解决许多与叙述相关的问题。在考虑小说作品(例如小说,戏剧,电影,电视剧)时,角色网络尤为重要,因为它们的开发允许开发信息检索和推荐系统。然而,小说作品具有特定属性,使这些任务更难。本调查旨在展示和组织与从小说作品中提取人物网络相关的科学文献,以及他们的分析。我们首先以通用的方式描述提取过程,并根据叙述的媒介,网络分析的目标和其他因素解释其构成步骤在实践中如何实施。然后,我们将回顾用于表征角色网络的描述性工具,重点关注它们在此上下文中的解释方式。我们通过提供对从其分析中得出的应用程序的回顾来说明角色网络的相关性。最后,我们确定了现有方法的局限性和最有希望的观点。

 


使用Google趋势和注意力

seq2seq模型预测流感患病率

原文标题: 

Sequence to Sequence with Attention for Influenza Prevalence Prediction using Google Trends

地址: 

http://arxiv.org/abs/1907.02786

作者: Kenjiro Kondo, Akihiko Ishikawa, Masashi Kimura


摘要: 早期预测流感的流行是有重大意义的。我们已经进行了各种研究来预测感染流感的人的数量。然而,这些研究并不是非常准确,并且时间越长久预测效果越差,例如超过一个月。为了解决这个问题,我们使用Google趋势数据调查序列(Seq2Seq)和注意模型,以评估和预测多周内感染流感的人数。Google趋势数据有助于补偿包括统计数据在内的黑箱数据并提高预测准确性。我们证明了注意机制对于提高预测精度和实现最新结果非常有效,Pearson相关和均方根误差分别为0.996和0.67。然而,流感疫情高峰期的预测准确性还不够,需要进一步研究以克服这一问题。



网络嵌入:压缩和学习

原文标题:

Network Embedding: on Compression and Learning

地址: 

http://arxiv.org/abs/1907.02811

作者: 

Esra Akbas, Mehmet Aktas


摘要: 最近,将图的结构信息编码到矢量空间中的网络嵌入已经变得流行用于网络分析已经变得流行。尽管最近的方法对于各种应用表现出有希望的性能,但是巨大的图尺寸可能妨碍将现有网络嵌入方法直接应用于它们。本文介绍了NECL,一种具有两个目标的新型高效网络嵌入方法。1)是否存在理想的网络压缩?2)网络的压缩是否会显著提升网络的代表性?对于第一个问题,我们提出了一种基于邻域相似性的图压缩方法,该方法压缩输入图以获得较小的图,而不会丢失关于图的全局结构和图中顶点的局部接近度的任何/大量信息。对于第二个问题,我们使用压缩图进行网络嵌入而不是原始大图来降低嵌入成本。NECL是一种通用的元策略,用于提高基于随机游走的所有最先进的图嵌入算法(包括DeepWalk和Node2vec)的效率,而不会失去其有效性。在大型真实世界网络上进行的大量实验验证了NECL方法的效率,该方法平均提高了23-57%的嵌入时间,包括游走和学习时间,而不会降低分类准确性,因为在现实世界中对单标签和多标签分类任务进行评估DBLP,BlogCatalog,Cora和Wiki等图表。

 

 

比特币交易网络与其价格

动态之间不断演化的联系


原文标题:

The evolving liaisons between the transaction networks of Bitcoin and its price dynamics

地址:

http://arxiv.org/abs/1907.03577

作者: 

Alexandre Bovet, Carlo Campajola, Francesco Mottes, Valerio Restocchi, Nicolò Vallarano, Tiziano Squartini, Claudio J. Tessone


摘要: 加密货币是一种分布式系统,允许参与者之间交换局部代币,或者在这些公共分类账之外的市场中交换法定货币的代币。其完整的历史记账的可得性,允许我们理解汇总用户行为与交换市场中加密货币定价之间的关系。本文分析了比特币交易网络的特性。在比特币创建以来的9年时间里,我们考虑了它的四种不同表示形式,涉及1600万用户和2.83亿笔交易。通过分析这些网络,我们证明了比特币价格变动与其交易网络拓扑变化之间存在因果关系。我们的结果揭示了结构数量之间的相互作用,表明比特币用户的集体行为和价格变动,表明在价格下降期间,系统特征为节点活动的异质性更大。

 



由高频手机位置数据

揭示的人类移动模式的特征


原文标题:

Characteristics of human mobility patterns revealed by high-frequency cell-phone position data

地址:

http://arxiv.org/abs/1907.03604

作者: 

Chen Zhao, An Zeng, Chi Ho Yeung


摘要: 人类活动是人类行为的一个重要特征,但由于追踪个性化位置到高时间和空间分辨率是困难的,因此大多数关于人类活动模式的研究很大程度上依赖于数学模型。开创性的,推测经常访问位置往往被重新访问的模型再现了广泛的统计特征,包括集体流动性通量和众多标度率但是,由于大多数可用数据无法提供必要的时间分辨率,因此无法在与我们的日常旅行模式相关的时间尺度上验证这些模型。在这项工作中,我们通过以高频率每秒记录的综合手机位置数据重新检查了人体移动机制。我们发现,在许多情况下,用户访问的下一个位置不是他们最常访问的位置。相反,个体在其短时间规模的移动性中表现出依赖于原因的路径优先模式。当数据的时间分辨率很高时,这些行为是显著的,因此在大多数先前的研究中被忽略。将来自我们的高频数据的测量量结合到传统的人体移动模型中显示出相互矛盾的统计结果。我们最终揭示了以一阶马尔可夫过程为特征的个体优先转换机制能够在所有相关时间尺度上,定量地再现在个体和群体水平上观察到的旅行模式。



我不是我所写的:

保留隐私的文本表示学习


原文标题:

I Am Not What I Write: Privacy Preserving Text Representation Learning

地址: 

http://arxiv.org/abs/1907.03189

作者:

Ghazaleh Beigi, Kai Shu, Ruocheng Guo, Suhang Wang, Huan Liu


摘要:在线用户通过参与不同的活动(例如撰写评论和分享推文)来生成大量的文本信息。该文本数据为研究人员和业务合作伙伴提供了学习和理解个人的机会。然而,该用户生成的文本数据不仅可以揭示用户的身份,还可以包含个人的私人信息(例如,年龄,位置,性别)。因此,俗话说“文如其人”。因此,发布文本数据会损害提供文本数据的个人的隐私。数据发布者需要通过在发布数据之前对数据进行匿名化来保护人们的隐私。设计有效的文本信息匿名化技术具有挑战性,这种技术可以最大限度地减少重新识别的可能性,并且不包含用户的敏感信息(高度隐私),同时保留给定任务的数据的语义含义(高效用)。在本文中,我们研究了这个问题并提出了一种新的双重隐私保护文本表示学习框架,DPText,它学习了一种文本表示:(1)差异私有,(2)不包含私人信息,(3)保留高效用对于给定的任务。我们评估两种自然语言处理任务,即情感分析和词性标注,我们在保护隐私和效用方面展示了这种方法的有效性。

 


基于流体的行走人群瓶颈分析


原文标题:

Fluid-Based Analysis of Pedestrian Crowd at Bottlenecks

地址:

http://arxiv.org/abs/1309.2785

作者: 

Peng Wang, Peter Luh


摘要: 在紧急出口中,人群行为严重影响出口效率和公共安全。通过将心理学原理与人群的牛顿运动相结合,本文推导出一种基于流体的方程,我们探讨当行人群经过瓶颈时,不同形式的能量是如何平衡的。这种基于流体的分析有助于弥合心理学发现,行人模型和模拟结果之间的差距,并进一步提供了一个新的视角来理解如何引起更快速的效果以及灾难性事件(例如,干扰)如何发生在瓶颈通道。

 



物联网生成的个人

数据的概念性市场模型


原文标题:

A Conceptual Marketplace Model for IoT Generated Personal Data

地址: 

http://arxiv.org/abs/1907.03047

作者: 

Victor Molina, Marta Kersten-Oertel, Tristan Glatard


摘要:我们为描述物联网生成的个人数据提出了一个分散的概念市场模型。我们的模型基于对市场环境中个人数据的全面分析,它特别关注物联网生成的个人数据商业化所带来的挑战。我们的模型通过风险评估和数据许可框架,为市场环境的个人数据商业化引入了新的视角。我们设计的模型旨在通过有效评估和修改交易风险的模型组件来保护数据生成器的隐私和数据权利,并通过建立买方和卖方之间的数据使用权和访问权来规范交易协议。我们的模型可以作为一个蓝图,为实现尊重隐私和所有权的个人数据市场提供信息。

 


确保技术产出可靠的成果


原文标题:

Ensuring Responsible Outcomes from Technology

地址: 

http://arxiv.org/abs/1907.03263

作者:

Aaditeshwar Seth


摘要:我们试图在这篇文章中提出两个论点。首先,通过一个我们已经在印度中部农村地区运行了六年多的,基于移动电话的语音媒体服务的案例研究,我们描述了几个实施上的困难,我们必须通过技术实现社会发展的预期愿景。这些复杂性大多出现在我们的技术与社会的接口中,我们认为即使是其他技术提供商也可以创建类似的流程来管理这种社会技术界面并确保其技术使用的预期结果。然后,我们构建了第二个论点,即如何确保市场驱动的技术和国家采用的技术背后的组织适当关注负责任地管理社会与技术创新的接口。我们倡导在这些组织内工作的技术工程师和研究人员,承担责任并确保他们的劳动力使世界变得更加美好,特别是对穷人和边化群体而言。我们概述了可能的治理结构,可以为技术开发人员提供更多的发言权,推动他们的组织确保从他们的技术中产生负责任的结果。我们注意到,我们用于构建论据的示例仅限于最终用户直接使用的当代信息和通信技术(ICT)平台,以便彼此共享内容,因此我们的论点可能无法以直接的方式推广到其他ICT 。

 

 


亚洲外汇市场的多重分形分析


原文标题:

A Multifractal Analysis of Asian Foreign Exchange Markets

地址:

http://arxiv.org/abs/0801.1475

作者: 

Gabjin Oh, Cheoljun Eom, Shlomo Havlin, Woo-Sung Jung, Fengzhong Wang, H. Eugene Stanley, Seunghwan Kim


摘要: 我们分析了1991年至2005年日本,香港,韩国和泰国相对于美元的每日外汇汇率的多重分形谱。我们发现返回时间序列显示了所有四种情况的多重分形谱特征。为了观察亚洲货币危机的影响,我们还估计了危机前后有限系列的多重分形谱。我们发现,与香港和日本相比,韩国和泰国的外汇市场在多重分形方面经历了显著增长。我们还表明,多重分形与系列中高回报值的存在有关。




分析参与预测的玩家


原文标题: 

Profiling Players with Engagement Predictions

地址: 

http://arxiv.org/abs/1907.03870

作者: 

Ana Fernández del Río, Pei Pei Chen, África Periáñez


摘要: 我们探讨了使用玩家参与度预测来描述高消费视频博弈用户的可能性。特别地,我们使用首次登录后的天数,玩家生存曲线,即达到的游戏等级和累计的登录时间能够将玩家能够将玩家分类为不同的组。每个玩家的终身价值预测将使用基于长期短期记忆的深度学习方法来生成,当然也包括在分析中,并且彻底调查所有这些变量之间的关系。我们的结果表明,这构成了一种有前途的用户分析方法。


 



Hahahahaha,

Duuuuude,Yeeessss!:

用两个参数表征可拉长单词

以及错误输入和拼写错误的动力学


原文标题:

Hahahahaha, Duuuuude, Yeeessss!: A two-parameter characterization of stretchable words and the dynamics of mistypings and misspellings

地址:

http://arxiv.org/abs/1907.03920

作者: 

Tyler J. Gray, Christopher M. Danforth, Peter Sheridan Dodds


摘要: 像’heellllp’或’heyyyyy’这样的拉伸词是口语的常规特征,通常用于强调或夸大词根的基本含义。虽然在正式的书面语言和词典中很少发现拉伸的词语,但它们在社交媒体中很普遍。在本文中,我们研究了在8年期间发表的大约1000亿条推文中发现的“可伸缩单词”的频率分布。我们引入两个中心参数,“平衡”和“拉伸”,捕捉它们的主要特征,并通过创建我们称为“平衡图”和“拼写树”的可视化工具来探索它们的动态。我们将讨论我们在这里开发的工具和方法如何用于研究错误拼写和拼写错误的统计模式,以及在扩充词典,改进语言处理以及序列构建重要的任何领域(如遗传学)中的潜在应用。

 



利用Ricci流的网络社区检测

原文标题: 

Community Detection on Networks with Ricci Flow

地址:

http://arxiv.org/abs/1907.03993

作者:

Chien-Chun Ni, Yu-Yao Lin, Feng Luo, Jie Gao


摘要: 现实世界中的许多复杂网络都有社区结构——具有重要功能角色的连接良好的节点组。众所周知,社区的识别具有许多实际应用。虽然现有方法主要应用统计或图论/组合方法进行社区检测,但在本文中,我们提出了一种新颖的几何方法,使我们能够借用强大的经典几何方法和属性。通过将网络视为几何对象和网络中的社区作为几何分解,我们应用曲率和离散Ricci流,用于分解数学上惊人成功的光滑流形,以打破网络中的社区。我们在具有地面实况社区结构的网络上测试了我们的方法,并通过实验证实了这种几何方法的有效性。

 



由于链路删除导致

有向网络上的传输丢失


原文标题:

Loss of transmission on directed networks due to link deletion

地址:

http://arxiv.org/abs/1907.04007

作者:

G. Kashyap, G. Ambika


摘要: 我们研究链路删除对在各种有向网络模型上发生的1对1传输过程的影响,并根据成功传输的分数和平均传输时间来表征它们。我们做出直观的论证,并在数值上表明成功传输的概率平均取决于强连通分量(SCC)的分数大小,平均传输时间取决于SCC的平均路径长度(APL)。在特定道路网络的背景下,我们研究各种过程参数的作用。最后,我们提供补救策略,以改善此类网络中链接删除期间的传输。

 



气候变化对欧洲分散

供热成本最佳组合的影响


原文标题: 

Impact of climate change on the cost optimal mix of decentralized heating in Europe

地址: 

http://arxiv.org/abs/1907.04067

作者: 

S. Kozarcanin, R. Hanna, I. Staffell, R. Gross, G. B. Andresen


摘要: 住宅对空间供暖和热水的需求占欧洲总能源需求的31%。空间加热高度依赖于环境条件,易受气候变化的影响。我们采用技术经济的立场,评估气候变化对分散供热需求和成本最优的供热技术组合的影响。来自IPCC的三个代表性浓度路径的九个气候模型的高空间分辨率的温度数据被用于估计气候引起的欧洲需求侧的变暖。需求方通过加热度日的主体建模。供应方通过使用筛选曲线方法来模拟热量产生的经济性。我们发现,在低浓度和中浓度通道中,空间加热需求降低了16%和24%。在最极端的全球变暖情景中,这种减少达到42%。在考虑历史天气数据时,我们发现不同的技术组合是成本最优的,具体取决于供热负荷系数(每年的满负荷小时数)。到本世纪末,环境温度的升高改善了所有浓度通道中热泵的经济性能。成本优化技术大体上与欧洲的热销市场和政策相对应,但有一些例外。

 



多任务学习检测黑市推特

原文标题: 

Multitask Learning for Blackmarket Tweet Detection

地址:

http://arxiv.org/abs/1907.04072

作者: 

Udit Arora, William Scott Paka, Tanmoy Chakraborty


摘要: 在线社交媒体平台使世界变得前所未有的联系,从而使每个人更容易在各种各样的受众中传播他们的内容。Twitter就是这样一个受欢迎的平台,人们可以发布推文,将消息传播给每个人。Twitter允许用户转发其他用户的推文,以便将其广播到他们的网络。特定推文获得的转推越多,其传播速度就越快。这通过使用某些黑市服务获得对其内容的无机评估,激励人们通过他们的推文获得人工增长。在本文中,我们试图检测已发布在这些黑市服务上的此类推文,以获得人为推动的转发。我们使用多任务学习框架来利用软参数来加强基于独立输入的分类和基于回归的任务之间的共享。这使我们能够有效地检测已发布到这些黑市服务的推文,在将推文分类为黑市或真品时获得0.89的F1分数。

 



跨国家和学科的科学

职业中性别不平等的历史比较


原文标题:

Historical comparison of gender inequality in scientific careers across countries and disciplines

地址: 

http://arxiv.org/abs/1907.04103

作者: 

Junming Huang, Alexander J. Gates, Roberta Sinatra, Albert-Laszlo Barabasi


摘要: 学术界存在广泛但分散的性别差异证据,表明女性在大多数科学学科中的代表性不足,她们在整个职业生涯中发表的文章较少,而且她们的工作获得的引用次数较少。在这里,我们通过重建150多万性别标志作者的完整出版历史,通过对学术生涯的纵向性别差异进行全面描述,这些作者的出版生涯在1955年至2010年期间结束,覆盖83个国家和13个学科。我们发现,矛盾的是,过去60年来妇女参与科学的人数增加,同时生产力和影响方面的性别差异也在增加。然而,最令人惊讶的是,我们发现了两个性别不变量,发现男性和女性以相当的年率出版,并且在相同规模的工作中具有相同的职业影响力。最后,我们证明了辍学率和职业生涯长度的差异解释了报告的职业生产率和影响力差异的很大一部分。这种关于学术界性别不平等的综合图景可以帮助重新围绕学术界女性职业生涯可持续性的对话,对机构和政策制定者产生重要影响。

 



揭示空间约束在物理和虚拟

移动性之间的差异和相似性中的作用


原文标题:

Uncovering the role of spatial constraints in the differences and similarities between physical and virtual mobility

地址: 

http://arxiv.org/abs/1907.04122

作者:

Surendra Hazarie, Hugo Barbosa, Adam Frank, Ronaldo Menezes, Gourab Ghoshal


摘要: 信息和通信技术(ICT)最近提供的数字痕迹促进了个人和人口层面运动的研究,并存在了前所未有的时空分辨率,使我们能够更好地理解诸如城市化,交通,影响等众多社会经济过程。比如环境和流行病的传播。利用经验时空趋势,已经提出了几种移动模型来解释人类运动中观察到的规律性。随着万维网的出现,出现了一种新型的虚拟移动性,它已经开始取代人类活动的许多传统方面。在这里,我们对物理和虚拟运动进行系统分析,揭示其统计模式的相似性和差异性。这些差异主要表现在时间制度中,作为物理运动中固有的空间和经济约束的特征,这些特征在虚拟空间中主要不存在。我们证明,一旦移动到与时间无关的事件空间,即访问位置的序列,这些差异就会消失,物理和虚拟移动性的统计模式是相同的。在导航这些明显不同的领域时观察到的相似性指向了一种控制运动模式的共同机制,我们通过Metropolis-Hastings类型优化模型描述了一个特征,这个特征中个体通过决策过程进行位置导航,类似于效用的成本效益分析的位置。与现有的移动现象学模型相比,我们证明了我们的模型能够以最小的输入重现经验观察统计中的共性。

 



信仰的位置和空间:

映射认知环境


原文标题: 

Belief places and spaces: Mapping cognitive environments

地址: 

http://arxiv.org/abs/1907.04191

作者: 

Philip Feldman, Aaron Dant, Wayne Lutters


摘要: 信仰不是事实,但它们是factive感觉就像事实。这个属性可以使错误信息变得危险。如果没有将线索,叙事形式的信息结合在一起,就无法显示它们之间的关系,那么能够刻意浏览经常相互矛盾的说明性语言的景观是很困难的。在本文中,我们提出了一种机制,用于生成信念地点的地图,其中人们就虚构环境的显著特征和信念空间达成一致,其中子群具有相关但不同的视角。使用基于主体的模拟开发的模型,我们通过观察人类参与者在同一社会环境中的重复行为,可以构建显示共享叙事环境的地图,其中覆盖有显示独特,个人或子群视角的痕迹。我们的贡献是一个概念验证系统,基于幻想桌面角色扮演博弈的可承受性,支持多个群体在受控的在线环境中与同一个地牢互动。这个过程中使用的技术在数学上是直截了当的,并且应该可以推广到从其他语料库中自动生成大规模的信念空间地图,例如社交媒体上的讨论。

 



ICLab:全球纵向互联网审查测量平台


原文标题: 

ICLab: A Global, Longitudinal Internet Censorship Measurement Platform

地址:

http://arxiv.org/abs/1907.04245

作者:

Arian Akhavan Niaki, Shinyoung Cho, Zachary Weinberg, Nguyen Phong Hoang, Abbas Razaghpanah, Nicolas Christin, Phillipa Gill


摘要: 研究人员研究互联网审查几乎与审查这件事有着同样长的历史。然而,大多数研究仅限于短时间和/或少数几个国家;少数例外情况已经覆盖了广泛的覆盖范围。收集足够的数据以获得全面的,全球性的纵向视角仍然具有挑战性。在这项工作中,我们展示了ICLab,一个专门用于审查研究的互联网测量平台。它通过使用商业VPN作为分布在世界各地的有利位置,在覆盖范围和测量细节之间实现了新的平衡。自2016年底以来,ICLab一直在不断运行。它目前可以检测DNS操作和TCP数据包注入,并且可以检测到它们是否已经交付“阻止页面”。ICLab详细记录和归档原始观察结果,使用新技术进行回顾性分析。在处理的每个阶段,ICLab都力求最大限度地减少误报和手动验证。在ICLab于2017年和2018年收集的53,906,532个单独网页的测量值中,我们观察到在60个国家/地区阻止了3,602个唯一网址。使用这些数据,我们比较了不同区域和/或不同类型内容中不同阻塞技术的部署方式。我们的纵向监测确定了印度和土耳其审查制度的变化以及政治转变,我们的聚类技术发现了48个以前未知的块页面。ICLab广泛而详细的测量还会暴露其他形式的网络干扰,例如监视和恶意软件注入。

 



夏令时规定下

的生活:为什么我们要

在废除夏令时之前三思而后行?


原文标题: 

Life under Daylight Saving Time regulations: why should we think twice before abolishing DST?

地址:

http://arxiv.org/abs/1907.04277

作者: 

José-María Martín-Olalla


摘要:我们分析了美国,西班牙,意大利,法国和英国的大规模(N~10000)时间使用的民意调查,以确定夏令时后的睡眠/觉醒周期和劳动周期的季节性变化 – 夏令时安排 – 法规已经存在至少四十年了。也就是说,不是通常寻找DST两年过渡的短期影响,而是寻找工业化社会如何响应DST法规。结果表明,劳动周期在季节中是平均分布的,这是日常经验,这是夏令时的主要结果。睡眠/清醒周期显示受太阳活动打扰的干扰:日出,日落和中午。一周内非员工睡眠时间(该群体更容易自由选择)在夏季延迟。然而,尽管春季过渡时间已经提前,但这一组的睡眠偏移量在夏季有所提升。对这些发现的最佳解释是DST法规的规模和方向性接近最佳。在西班牙,意大利和美国的睡眠/觉醒周期之后讨论纬度的作用在英国和法国的睡眠/觉醒周期表现出较少的统计上显著的偏移,这可能表明随着纬度的增加偏好时间同步。从以前的人类活动报告中可以看出,时钟的季节性调节与永久夏令时或永久冬季时间的选择有关。


 

来源:网络科学研究速递

审校:陈曦

编辑:张爽


声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。



近期网络科学论文速递


通过移动数据了解在线新闻消费模式 等9篇

比特币网络的污点分析 等14篇

新浪微博用户画像 等29篇

符号图注意力网络 等20篇

个性化社交媒体短文本的自动条件生成 等27篇

加入集智,一起复杂!





集智


集智俱乐部QQ群|877391004

商务合作及投稿转载|swarma@swarma.org

◆ ◆ 

搜索公众号:集智俱乐部


加入“没有围墙的研究所”

集智

让苹果砸得更猛烈些吧!

原文始发于微信公众号(集智俱乐部):集智