集智

核心速递

  • 你的立场暴露了!社交媒体立场检测的可能因素分析;
  • 欧洲电力市场的主要跨境流动模式;
  • 精英主导社会中的人口崩溃:一个没有微分方程的微分方程模型;
  • 选举干扰的非合作动态;
  • 研究领导流决定因素和研究合作网络中的邻近关系;
  • 单纯复形的中心性度量:拓扑数据分析在网络科学中的应用;
  • 用户在双面互联网平台上的流量定性研究;
  • 强化学习演化博弈中集体行为的振荡演化;
  • 优化记忆揭示了多智能体竞争的生存策略;
  • 效率的偏好而不是道德偏好,推动了一次性Stag-Hunt博弈中的合作;
  • 评估社交媒体表达立场的情绪;
  • 严格图对齐;
  • 从信息级联利用贝叶斯推断网络结构;
  • 优化相互连接网络中的传播动态;
  • 社交媒体中视觉叙事的基准;
  • 使用机器学习和城市指标重建通勤者网络;

你的立场暴露了!社交

媒体立场检测的可能因素分析

原文标题:
Your Stance is Exposed! Analysing Possible Factors for Stance Detection on Social Media
地址:
http://arxiv.org/abs/1908.03146
作者:
Abeer Aldayel, Walid Magdy
摘要:从多大程度上可以推断出用户对某个主题的立场呢?大多数关于立场检测的研究都集中在分析用户关于给定主题的帖子以预测立场。然而,社交媒体中的立场可以从可能反映用户立场(包括帖子和在线互动)的信号混合中推断出来。本文研究了用户的各种在线特征,以检测他们对不同主题的立场。我们比较了多组特征,包括主题内容,网络交互,用户偏好和在线网络连接。我们的目标是了解可以反映用户立场的在线信号。实验应用于来自SemEval立场检测任务的推文数据集,该任务涵盖五个主题。研究结果表明,可以通过用户在线活动的多个信号来检测用户的立场,包括他们关于主题的帖子,他们与之交互或跟踪的网络,他们访问的网站以及他们喜欢的内容。使用不同网络特征的立场建模的性能与仅使用文本内容的最新报告模型相当。此外,结合网络和内容功能,在SemEval数据集上获得了迄今为止报告的最高性能,F-measure为72.49%。我们进一步展示了一个广泛的分析,以显示这些不同的特征如何能够揭示立场。我们的研究结果具有明显的隐私含义,他们强调用户的在线社会网络中的立场是根深蒂固的。原则上,可以通过他们的交互和联系进行分析,即使他们没有发布有关该主题的内容。

欧洲电力市场的主要跨境流动模式

原文标题:
Principal Cross-Border Flow Patterns in the European Electricity Markets
地址:
http://arxiv.org/abs/1908.02848
作者:
Mirko Schäfer, Fabian Hofmann, Hazem Abdel-Khalek, Anke Weidlich
摘要: 欧洲电力市场是关联密切的,在不同国家之间有相当大的跨境贸易。结合电网的结构、技术特性及其运行规则,相应的商业关联转化为实际相连的物理线路。因此,在不同的物理,技术和经济因素的相互作用下,出现了复杂的时空潮流模式。本文运用主成分分析法,分析了2017年和2018年欧洲国家之间每小时跨境物流的时间序列,确定了进出口和跨境实体金融流量时间序列中最重要的模式,描述了它们的空间和时间结构,以及它们对整体方差的贡献。此外,本文还将跟踪技术应用于整个的流模式,这允许通过公共电网基础设施识别欧洲国家之间的物理电力传输。

精英主导社会中的

人口崩溃:一个没有

微分方程的微分方程模型

原文标题:
Population collapse in Elite-dominated societies: A differential equations model without differential equations
地址:
http://arxiv.org/abs/1908.02870
作者:
Naghmeh Akhavan, James A. Yorke
摘要:Motesharrei、Rivas和Kalnay的HANDY模型研究了穷人(平民)、富人(精英)与环境之间的互动。精英控制着社会的财富,并以比普通人更高的速度消费它,他们的工作创造了财富。当精英的人均人口变化率总是至少与平民一样大时,我们认为模型是“精英主导的”。研究发现,对于精英主导的所有参数值选择,HANDY模型总是表现出人口崩溃。但是,任何具有显式方程的模型都会产生问题,即结果如何依赖于模型的细节。特殊设计特征在微分方程中的编码有多重要?在本文中,我们首先用仅在概念上或定性上描述的微分方程代替HANDY的显式方程,同时,仅使用可验证显式系统的条件。接下来,我们完全抛弃方程式,用定性条件代替它们,并且我们证明这些条件意味着必须发生人口崩溃,特别是当该模型是由精英主导时。研究表明,由精英主导参数的HANDY模型符合我们的假设,因此必须经历人口崩溃。我们引入定性数学假设的方法可以更好地显示导致崩溃的模型的基本特征。我们还将对社会如何避免崩溃问题进行深入研究。

选举干扰的非合作动态

原文标题:
Noncooperative dynamics in election interference
地址:
http://arxiv.org/abs/1908.02793
作者:
David Rushing Dewhurst, Christopher M. Danforth, Peter Sheridan Dodds
摘要:外国势力干涉国内选举是是一种常见的且具有潜在政治威胁的行为。从战争到文字的的各种方法都体现了这种干涉,这是经济和政治主体之间战略互动的及时例证。我们将理性博弈者之间的这种相互作用建模为连续时间的差分博弈,构建了一个具有多种支付结构构的竞争分析模型。当仅有一个参与者对干涉行动的影响采取完全理会或完全不理会的态度时,这种结构导致了军备竞赛的发生,其中两国都在干涉和反干涉行动上花费越来越多的资金。然后,我们用2016年美国总统选举竞赛中有关俄罗斯干涉的数据来训练我们的模型,引入和估计基于俄罗斯网络巨魔的选举民意调查和社交媒体帖子的贝叶斯结构时间序列模型。(所谓的网络恶魔会把网络看成战场,在论坛或者其他在线群体中发布引发激烈争执的帖子)研究表明,我们的分析模型虽然有目的地抽象和简单,但充分地捕捉了选举和社交媒体活动的许多时间特征。

研究领导流决定因素和

研究合作网络中的邻近关系

原文标题:
Research Leadership Flow Determinants and the Role of Proximity in Research Collaborations Networks
地址:
http://arxiv.org/abs/1908.02951
作者:
He Chaocheng, Wu Jiang, Zhang Qingpeng
摘要:科学研究中的领导特征对于揭示研究协作的互动模式和组织结构具有重要意义。本文以作者的隶属关系为基础,对领导角色进行了界定,并首次对地理、认知、制度、社会和社会五个邻近维度的因素和演变进行了定量研究。研究领导力的数据包括2013-2017年生命科学和生物医学领域的一系列多机构文章,来自Web of Science核心引文数据库。我们的样本包括来自244家中国机构的484,903篇文章,这些文章中每年至少一篇论文与相应的作者存在主要隶属关系。基于Tobit回归的引力模型表明,领导机构和参与机构的研究领导质量以及地理、认知、制度、社会和经济接近度是中国机构研究领导流的重要因素。总而言之,这些因素对研究领导力流动的影响最近一直在下降。这项研究的成果揭示了中国机构的领导力演变和流动,从而可以为资助分配政策提供证据和支持,并促进科学研究和合作。

单纯复形的中心性度量:

拓扑数据分析在网络科学中的应用

原文标题:
Centrality measures in simplicial complexes: applications of TDA to Network Science
地址:
http://arxiv.org/abs/1908.02967
作者:
Daniel Hernández Serrano, Darío Sánchez Gómez
摘要: 在社会科学、生物和生物医学科学或计算机科学中,许多真实网络都具有反映多体相互作用的固有的单纯复形结构。利用相关文献里单纯复形结构中单纯形的邻接度和度数的高阶概念,我们提出了单纯复形结构中新的中心性度量,其包含了大量有意义的信息,主要包括主体相关性、单一社区主体相关性、社区之间的相关性、子社区间的相关性等。这些措施不仅可以研究网络中单一社区的相关性,还可以阐明单一网络的拓扑性质和动态特性。我们首先从与广义高阶度概念相关的中心性度量开始,这些度量对于任何维度的比较都是有效的,它们需要理解不同协作的单一群落之间的关系,并研究单一复杂网络中的高阶度分布。然后,我们定义单纯复形中的步和距离的概念,以研究单一网络的连通性,并将结果概括为众所周知的紧密性和介数中心性。(例如,研究单一社区在其能力方面的相关性时,需要传输信息)最后,我们在单纯复形中定义单纯形的聚类系数,它概括性度量了顶点的标准图聚类,并且不仅要知道节点周围的聚类,还要知道单一网络中单一社区周围的聚类,它可能是有助于理解群体和单一社区如何在一个单一网络中演化的。

用户在双面互联网

平台上的流量定性研究

原文标题:
Users’ traffic on two-sided Internet platforms. Qualitative study
地址:
http://arxiv.org/abs/1908.03059
作者:
Victoria Rayskin
摘要:互联网平台的流量定义了平台的重要特征,例如服务定价、广告以及运营速度。我们可以使用ARIMA,Holt-Winters,函数和核回归等传统时间序列模型来估计流量。当使用这些方法时,我们通常会消除数据中的噪声和各种外部影响,并获得序列的短期预测。然而,这些模型并不一定能帮助我们理解时间序列的潜在机制和趋势。本文讨论了动力学系统建模方法,旨在发现系统相位图的基本机制和定性属性。我们展示了如何从数据中重建控制微分方程。外部影响被建模为系统参数(初始条件)。利用这种新方法,我们基于用户量建立模型,并通过互联网平台进行交互,例如Amazon.com,Homes.mil或Wikipedia.org。然后,我们对系统的相位图进行定性分析,并讨论平台的主要特征。

强化学习演化博弈中

集体行为的振荡演化

原文标题:
Oscillatory evolution of collective behavior in evolutionary games played with reinforcement learning
地址:
http://arxiv.org/abs/1908.03060
作者:
Si-Ping Zhang, Ji-Qiang Zhang, Li Chen, Xu-Dong Liu
摘要: 大规模合作是生态系统和人类社会演化的基础,多主体智能体系自组织的集体行为是理解的关键。由于人工智能(AI)在几乎所有科学分支中都很流行,因此,可以从多智能体AI系统中获得对集体行为的新见解。在此,我们将一种典型的强化学习(RL)算法Q学习引入到演化博弈动力学中,在进化博弈中,主体基于内省性而不是传统进化博弈(EG)中的生-死或模仿过程来进行操作时间行为。我们通过数字方式调查合作普遍性,以获得一般的2X2博弈设置。我们发现,在大多数情况下,多智能体AI中的合作普遍性与传统EG中的水平相当。然而,在RL的雪堆博弈中,我们也发现了爆炸性合作以周期性振荡的形式出现,并研究了收益结构对其出现的影响。最后,我们证明了在RL算法的某些其他EG过程中也可以观察到周期性振荡,例如石头剪刀博弈。我们的研究结果为从AI的角度理解自然和社会中合作和振荡行为的出现提供了参考点。

优化记忆揭示了

多智能体竞争的生存策略

原文标题:
Optimized Memory Reveals the Survival Strategy for a Multi-agent Competition
地址:
http://arxiv.org/abs/1908.03076
作者:
Moein Khalighi, Jamshid Ardalankia, Abbas Karimi Rizi, Haleh Ebadi, Gholamreza Jafari
摘要: 我们提出了一个分数模型,以阐明在多主体智能经济领域如何以及在什么情况下——新成立的企业在整个市场中延续其已经存在的动态演变。由于市场上新成立公司数量的增加通常会导致竞争者的市场份额减少,一段时间后,一些公司可能会在市场上逐渐消失。在这方面,考虑到公司的长期发展,所有公司都面临着被淘汰并放弃其市场份额的风险。这就是为什么管理者需要吸引更多的客户来满足其最低市场份额,并且理想地延长他们公司的生命周期。另一方面,由于在某个行业建立了更多新成立的企业,因此灵活实施新战略至关重要。触发的策略不仅要准时,而且必须延长额外的生存时间。研究表明,在进化过程中,记忆的存在或缺乏可能并非如此,但是有一个策略在生存中起着重要作用。因此,尽管存在市场份额缺失的风险,但与整个市场相比,对较弱的公司提供的服务和产品的支持可能会延长其在市场上生存的时间。在这方面,与弱势公司相对应的管理者将能够对两个主要概念进行定量决策,首先是战略性地使用公司声誉,其次是推出新的功能和服务。这种优化背后的目标是延迟达到最低市场份额的时间。

效率的偏好而不是

道德偏好,推动了一次性

Stag-Hunt博弈中的合作

原文标题:
Preferences for efficiency, rather than preferences for morality, drive cooperation in the one-shot Stag-Hunt Game
地址:
http://arxiv.org/abs/1908.03091
作者:
Valerio Capraro, Ismael Rodriguez-Lara, Maria J. Ruiz-Martos
摘要: 最近的工作强调,在一次性囚徒困境(PD)中的合作主要是由对做正确事情的道德偏好驱动的,而不是社会对公平或效率的偏好。相比之下,我们目前还不知道是什么推动了Stag-Hunt Game(SHG)的合作。 SHG的合作从根本上不同于PD的合作,因为其合作成本不高,但风险很大:玩家没有偏离合作结果的诱惑,但只有在其他玩家合作的情况下,合作才会有回报。在这里,我们提供来自大型(N = 436)预先注册的实验数据。与PD观察到实验结果的相反,我们发现SHG合作主要是由效率偏好驱动,而不是偏好做正确的事情。

评估社交媒体表达立场的情绪

原文标题:
Assessing Sentiment of the Expressed Stance on Social Media
地址:
http://arxiv.org/abs/1908.03181
作者:
Abeer Aldayel, Walid Magdy
摘要: 立场检测是对给定的主题或实体进行支持或反对的观点推断的任务。人们可以通过使用正面或负面语言来表达对主题的观点。本文从情感极性的角度考察了社会媒体如何表达这种立场。在观点发现方面,人们对立场和情绪之间的相似性存在明显的误解,其中负面情绪被认为是反对立场,积极的情绪被认为是支持立场。为了分析立场和情感之间的关系,我们构建了一个包含四个主题的新数据集,并研究人们如何表达他们对这些主题的观点。我们通过对流行的立场基准SemEval立场数据集进行进一步分析来验证我们的结果。研究表明,情绪和立场不是高度一致的,因此简单的情感极性不能仅用于表示对特定主题的立场。

严格图对齐

原文标题:
Rigid Graph Alignment
地址:
http://arxiv.org/abs/1908.03201
作者:
Vikram Ravindra, Huda Nassar, David F. Gleich, Ananth Grama
摘要: 图形数据库是数据库、数据分析和应用程序社区中重要的研究和开发主题。模块化,中心性,对齐性和集群性等问题已在各种应用环境中形式化并得到解决。在本文中,我们关注的是应用程序的数据库,其中图具有空间基础,我们称之为刚性图。这些图中的节点相对于其邻居具有优选的位置。这种图的示例包括大生物分子的抽象(例如,在药物数据库中,其中化学键对应的边具有首选长度),人脑的功能连接体(例如,HCP数据库),其中大脑共烧区对应的边具有首选解剖距离和移动设备/传感器通信日志,其中与设备间点对点通信相对应的边缘具有距离限制。在分析这样的网络时,考虑边长是很重要的;例如,当通过图对齐来识别保守模式时,除了拓扑相似性之外,保守边缘还必须具有相关的长度。对于聚集(短边的密集连接区域)和中心性(具有大权重的临界边),也存在类似的考虑。本文主要研究刚性图的对齐问题。与拓扑图对齐的大量工作相反,刚性图对齐同时对齐网络以及由边长度表征的底层结构。我们提出一种基于期望最大化的元算法,该算法交替地对齐网络和结构。我们证明,与单独的拓扑或结构对齐器相比,我们的元算法显著提高了目标应用中的对齐质量。我们将刚性图对齐应用于人类连接项目(HCP)数据库的20个受试者的功能性脑网络,并显示出比现有最先进技术的拓扑对齐器的对齐质量提高了两倍以上。通过对合成图的研究,我们评估了与输入数据集相关的各种参数的影响,在合成图中我们充分描述了我们方法的性能。我们的结果广泛适用于其他应用和可嵌入度量空间的抽象网络,例如通过光谱嵌入。

从信息级联利用

贝叶斯推断网络结构

原文标题:

Bayesian inference of network structure from information cascades
地址:
http://arxiv.org/abs/1908.03318
作者:
Caitlin Gray, Lewis Mitchell, Matthew Roughan
摘要:传染过程与其传播的网络结构密切相关,学习这些结构对于理解和干预流行病和(MIS)信息传播等复杂网络过程至关重要。然而,利用传染数据来推断网络结构是一个具有挑战性的反问题。特别是,在网络结构估计中必须有适当的不确定性度量,但是在大多数机器学习方法中,这些都被忽略了。我们提出了一个概率框架,该框架使用来自网络分布的样本,这些样本与观测到的动力学相兼容,以生成网络和不确定性估计。我们利用已知的独立级联模型,在一组感染C的观察条件下,从P(G)网络的分布中进行采样。我们通过使用每个边的边际概率来评估方法的准确性,并显示量化不确定性的好处,以改善估计和理解,特别是对少量数据的理解。

优化相互连接网络中的传播动态

原文标题:
Optimizing spreading dynamics in interconnected networks
地址:
http://arxiv.org/abs/1908.03406
作者:
Liming Pan, Wei Wang, Shimin Cai, Tao Zhou
摘要:在相互连接网络的层之间添加边缘是优化扩散动力学的重要途径。虽然以前的研究主要集中在添加单个边的情况,但添加多个边的理论最优策略仍然需要研究。我们基于SIS模型,研究了最大化互联网络中固定传播流行率的问题。对于两个孤立的网络,我们通过选择多个互连边来最大化临界点附近的传播流行率。我们提出了一种基于离散马尔可夫链方法的理论分析,以推导出近似最优策略。该策略预测的最优层间结构最大限度地提高了互联网络的传播流行率,同时也最大限度地降低了互联网络的传播爆发阈值。对合成网络和真实网络的数值模拟表明,在临界点附近,所提出的策略比连接高度值节点和随机连接具有更好的性能。

社交媒体中视觉叙事的基准

原文标题:
A Benchmark of Visual Storytelling in Social Media
地址:
http://arxiv.org/abs/1908.03505
作者:
Gonçalo Marcelino, David Semedo, André Mourão, Saverio Blasi, Marta Mrak, João Magalhães
摘要:新闻编辑室的媒体编辑经常被要求提供使人身临其境的现场报道。社交媒体提供了一组杂乱无章的图片和视频,媒体专业人员在发布最新新闻之前需要掌握这些图片和视频。利用社交媒体内容进行自动化新闻视觉故事情节编辑可能非常具有挑战性,因为它不仅需要确定正确的内容,还要确保新闻内容随着时间的推移协调发展。为了解决这些问题,本文提出了评估社会媒体视觉故事情节的基准。“社会故事基准”由40个涉及体育和文化活动的策展故事组成,提供实验设置,并引入新的定量指标,以使用社会媒体数据对视觉故事讲述进行严格评估。

使用机器学习和城市

指标重建通勤者网络

原文标题:
Reconstructing commuters network using machine learning and urban indicators
地址:
http://arxiv.org/abs/1908.03512
作者:
Gabriel Spadon, Andre C. P. L. F. de Carvalho, Jose F. Rodrigues-Jr, Luiz G. A. Alves
摘要:从基础设施规划和经济学到疾病和犯罪的传播,人口流动对社会的各个层面产生重大影响。将系统表示为一个复杂网络,其中节点被分配给区域(如城市),并且连接表示其中两个区域之间的人流量,提出了物理启发的模型来量化从一个城市迁移到另一个城市的人数。尽管这些模型取得了进步,但我们预测通勤人数和重建移动网络的能力仍然有限。在这里,我们提出了一种使用机器学习和22个城市指标来预测人流量和重建城际通勤网络的替代方法。研究结果表明,基于机器学习算法和城市指标的预测能够以90.4%的准确度重建通勤网络,并描述城市间人口流动中观察到的77.6%的方差。我们还确定了恢复网络结构的基本功能以及主要与通勤模式相关的城市指标。如前所述,距离在通勤方面起着重要作用,但其他指标,如国内生产总值(GDP)和失业率,也是人们通勤的驱动力。我们相信,我们的结果为移民模型提供了新的亮点,并加强了城市指标对通勤模式的作用。此外,由于链路预测和网络重建仍然是网络科学中的开放挑战,我们的结果在经济学、社会科学和生物学等其他领域也有一定的影响,其中节点属性可以为我们提供有关连接实体的链接存在的信息。

来源:网络科学研究速递

审校:赵子鸣

编辑:张爽

声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。

近期网络科学论文速递

如何量化研究城市环境中的不平等 | 网络科学论文速递19篇

什么样的科学家更容易在国家之间流动 | 网络科学论文速递16篇

从社交媒体和用户生成的内容中解锁分析价值 | 网络科学论文速递22篇

Facebook是否将敏感数据用于广告目的?| 网络科学论文速递18篇

从社交媒体图像理解立法者的政治倾向 | 网络科学论文速递15篇

加入集智,一起复杂!


集智

集智俱乐部QQ群|877391004

商务合作及投稿转载|swarma@swarma.org

搜索公众号:集智俱乐部

加入“没有围墙的研究所”

集智

让苹果砸得更猛烈些吧!

原文始发于微信公众号(集智俱乐部):集智