集智斑图顶刊论文速递栏目上线以来,持续收录来自Nature、Science等顶刊的最新论文,追踪复杂系统、网络科学、计算社会科学等领域的前沿进展。现在正式推出订阅功能,每周通过微信服务号「集智斑图」推送论文信息。


扫描下方二维码,关注“集智斑图”服务号,即可订阅Complexity Express:             



Complexity Express 一周论文精选




以下是2022年1月24日-2022年1月30日来自Complexity Express的复杂性科学论文精选。如果Complexity Express列表中有你感兴趣的论文,欢迎点赞推荐,我们会优先组织解读~

目录:
1、达尔文基因组学与生命树的多样性
2、时序网络的记忆形状
3、神经元通过预测未来活动来学习
4、基于学习随机掩模的生物序列神经网络解释
5、活性物质的时间不可逆性:从微观到宏观
6、时滞系统的保守孤子与可逆性
7、感知距离的社会视角揭示了社区的深层结构
8、快速的回应速率标志着对话中的社会联系



1.达尔文基因组学与生命树的多样性


论文题目:Darwinian genomics and diversity in the tree of life

论文来源:PNAS

论文链接:https://www.pnas.org/content/119/4/e2115644119


基因组学研究的对象涵盖了整个生命之树,无论是灭绝的物种还是现存的物种,乃至塑造这种多样性的进化过程。迄今为止,基因组研究主要集中在人类、少数农业物种和建立的实验室模型上。在 GenBank 数据库中,约 200万个真核物种中只有不到 18000 个(<1%)具有代表性的基因组序列,其中只有一小部分具有关于基因组结构、遗传变异、基因表达、表观遗传修饰和种群多样性的辅助信息。


图1:序列读取档案 (SRA) 中的物种多样性。人类数据量超过了下一个前 10 个物种的数据量,以 (A) terabases 和 (B) 个体测序来衡量。(C) 2010-2020 年间人类比例增加,(D) 来自没有已知商业/医学相关性的物种(“其他”)的比例下降。(E) 一小部分 IUCN 认可的 (80) 物种具有参考基因组(红色)或在 SRA 中以其他方式表示(深灰色)。检索于 2020 年 11 月 14 日。


这种不平衡性反映了人类研究在疾病研究中至关重要的地位。然而,了解基因组如何工作,以及遗传变异如何塑造表型,需要一个包含生命多样性的广阔视野。我们拥有收集有关世界的海量且极其详细的数据集的技术,但眼下的一个重要问题是,专家们被过度分散到不同领域中。在当下,寻找一种将比较基因组学与细胞和进化生物学、生态学、考古学、人类学和保护生物学相结合的新方法对于理解和保护我们自己和我们的世界至关重要。在本文的最后,研究者提出了六条建议来改善基因组学研究所面临的问题:把生物学作为开展对话的起点;增加计算生物学家的数量;在所有相关领域做好计算生物学的综合训练;扩大科学传播的培训机会;进行数据共享以及以更大力度支持博物馆事业。


图2:不同类型的研究人群具有不同的优势。“多样性”:种群的遗传多样性,从近交系(例如实验室小鼠)到远交/高度多样化。人类(中点)远交,但不如许多物种多样化。“复杂性”:性状的遗传复杂性;在实验室小鼠中较低,具有受控的遗传背景和环境,在人类中较高,其中大多数特征都是复杂的。“表型分析”:易于收集表型数据,范围从仅在自然环境中进行非侵入性表型分析,到侵入性实验室表型分析。在人类(中点)中,电子病历等资源使大规模收集详细的表型成为可能,但并不容易。“采样”:易于采集样本,从仅对野生捕获个体进行微创采样,到可以实施安乐死和组织采集的种群。“样本量”:可以采样的个体数量,范围从小于100(需要昂贵护理的濒危物种或实验动物)到数百万(人类)。“功能”:功能基因组学(表观基因组学、细胞和类器官模型、基因工程等)的潜力。在人类中,细胞模型很发达,但无法进行生物体水平的实验。



2.时序网络的记忆形状


论文题目:The shape of memory in temporal networks

论文来源:Nature Communications

论文链接:https://www.nature.com/articles/s41467-022-28123-z


如何最好地定义、检测和表征网络记忆,即网络结构对其过去的依赖性,目前是一个有争议的问题。在这里,我们展示了时序网络的记忆本质上是多维的,并且我们引入了一个数学框架来定义和有效地估计记忆的微观形状,它描述了每个链接的活动如何与所有其它链接的活动相关联。我们在一系列合成模型上验证了我们的方法,然后我们研究了跨越社会、技术和生物系统的现实世界时序网络的记忆形状,发现这些网络的记忆形状各异。特别地,线上和线下社会网络明显不同,后者表现出更广泛的记忆模式与尺度。我们的理论还阐明了涌现虚拟循环的现象,并为探索复杂系统的丰富动力学结构提供了一种新方法。


图:具有 N = 10 个节点和 L = 45 个链接,其动力学既自相关又异质互相关的全连接时序网络 G,由参数 q = 0.9、y = 0.5、c = 0.7 和从 {0, 1, …, 6} 以均匀(panel (a))或双峰(panel (b))概率随机采样的一组记忆长度 p 决定的eCDARN(p)模型生成。a 共记忆矩阵 M 的 45 × 45 个条目(用颜色显示)在链接对的微观尺度上显示了网络记忆的形状。在这种特定情况下,eCDARN(p) 模型的表现使得链接依赖关系的因果结构被限制在 L = 45 个节点的贝叶斯环拓扑中,因此当链接 α 从其他链接的过去历史中对其活动进行采样时,它从α ± 1中随机采样。网络的标量记忆为Ω(G)=6。由于虚拟循环的开始,贝叶斯环中的成对相邻或紧密链接表现出高共阶记忆,通常高于 Ω(G);而远距离链接很少互相关,因此显示低共阶记忆。b 与 (a) 类似,但链接的因果结构由不同的贝叶斯图给出。出现了明显不同的记忆形状,但网络的标量记忆仍然是 Ω(G)=6。c 两个例子中的记忆共阶分布间显示了显著的异质性,且在这两种情况下都无法很好地用 Ω(G) 来表征。



3.神经元通过预测未来活动来学习


论文题目:Neurons learn by predicting future activity

论文来源:Nature Machine Intelligence

论文链接:https://www.nature.com/articles/s42256-021-00430-y


了解大脑如何学习有助于制造具有与人类类似智力水平的机器。之前有理论提出,大脑可能是根据预测编码的原理运行。然而,对于预测系统如何在大脑中实现还没有很好的解释。这项研究证明,单个神经元预测其未来活动的能力可能提供了一个有效的学习机制。有趣的是,这种预测性学习规则可以从新陈代谢原理中推导出来,即神经元需要最小化其自身的突触活动(代价),同时通过笼络其他神经元来最大化对局部血液供应的影响。我们展示了这个数学推导的学习规则如何在不同类型的大脑启发式算法之间提供理论联系,从而推动神经学习的通用理论的发展。我们在神经网络模拟和清醒动物的记录数据中测试了这种预测性学习规则。我们的结果还表明,自发的大脑活动为神经元学习并预测皮质动力学提供了“训练数据”。因此,单个神经元减少意外——即实际活动和预期活动之间的差异——的能力,可能是理解大脑计算的一个重要缺失因素 。


图2. 预测学习算法示意图。(b) 自由阶段,不同刺激下的神经元活动(用蓝色阴影标记)。(c) 突触权重根据夹紧阶段和预测的自由阶段的稳态活动之间的差异进行调整。



4.基于学习随机掩模的

生物序列神经网络解释


论文题目:Interpreting neural networks for biological sequences by learning stochastic masks

论文来源:Nature Machine Intelligence

论文链接:https://www.nature.com/articles/s42256-021-00428-6


基于序列的神经网络可以利用大型生物数据集学习做出准确的预测,但模型的可解释性上仍然存在挑战。许多现有的特征属性的方法是针对连续而非离散的输入模式进行优化的,并且孤立地评估个体特征的重要性,这使得它们不适合于解释分子序列中的非线性相互作用。本文在计算机视觉和自然语言处理工作的基础上,提出一种基于深度学习的方法——扰码器网络(scrambler network),可通过序列不同位置的打分值,得到可预测位置特定的特征重要性的打分矩阵,其中不重要的核苷酸随机打乱后,会导致模型熵的增加。我们应用Scrambers来解释遗传变异的影响,揭示DNA序列中调控元件之间的非线性相互作用,可解释蛋白质-蛋白质相互作用的结合特异性,并识别新设计蛋白质的结构决定因子。我们展示了Scamblers能够在大型数据集上高效确定重要的特征,并产生高质量的解释,通常表现优于最先进的方法。


图:Scramblers 模型的高层结构和训练方法示意图。



5.活性物质的时间不可逆性:

从微观到宏观


论文题目:Time irreversibility in active matter, from micro to macro

论文来源:Nature Reviews Physics

论文链接:https://www.nature.com/articles/s42254-021-00406-2


活性物质包含一些系统,其个别组成成分会消耗能量,从而对环境施加推动力。这一迅速发展的领域表现出在被动系统中没有对应的动态学现象,这在很大程度上源于时间可逆性的打破。在这篇综述中,基于这一领域的最新进展,我们理顺了在单体和多体活性系统中时间之箭和稳态涨落的非玻尔兹曼性质各自的作用。我们证明在所有尺度上都可以找到有效的、时间可逆的活性系统描述,并讨论了组分之间或外部操作之间的相互作用如何揭示微观能量源的非平衡性质。随着活性材料工程变得日益可实现,我们认为讨论平衡统计力学方法可能指导新活性材料的设计。


图:流体中被动粒子和活性粒子受到的作用力不同。(左)与流体分子相互作用形成的胶体动力学。平均产生的力是阻力 -γv,它通过相反方向的运动耗散能量,而其周围的涨落(由高斯白噪声ηth描述)将能量注入胶体的动力学中。当流体处于平衡态时,注入和耗散由涨落耗散定理联系起来。(右)细菌的推进源于消耗一个与耗散无关的独立的能量源。



6.时滞系统的保守孤子与可逆性


论文题目:Conservative solitons and reversibility in time delayed systems

论文来源:Physical Review Letters

论文链接:https://journals.aps.org/prl/accepted/c0076Ya6We21eb78923d9d574242430b2096ccef4


时滞动力系统已被证明是研究复杂系统的一个丰富框架。在物理学中,它们一直被局限于耗散动力学的研究。在本文中,我们证明非线性可逆保守时滞系统的存在,考虑了一个含有克尔介质的色散微腔与遥远的外部镜片耦合的例子。在低能量和长延时极限下,多尺度分析显示了非线性薛定谔方程的等价性。我们揭示了一些对称性和守恒量,以及清晰的时间孤子。当浅波包发生弹性碰撞时,我们观察到其在更高的能量下缺乏可积性。此外,我们还推导了弱耗散区域上的Lugiato-Lefever方程 。



7.感知距离的社会视角

揭示社区的深层结构


论文题目:A social perspective on perceived distances reveals deep community structure

论文来源:PNAS

论文链接:https://www.pnas.org/content/119/4/e2003634119


社区结构,包括群体之间和群体内部的关系,是我们理解周围世界的基础。对于基于差异的数据,利用冲突和对齐的社会概念,我们提供了一种方法来捕获由诱导的局部比较产生的有意义的结构信息。特别是,我们引入对局部(社区)深度的度量,它直接导致概率划分,传递了局部解释的亲密度(或凝聚力)。一种用于区分强和弱内聚对的普遍阈值选择允许同时考虑局部和全局结构。可能受益于该方法的情况包括具有不同密度的数据,例如由不同机制驱动局部演化的复杂过程的快照。响应密度的内在重新校准允许人们回避使参数局域化的需要,这是许多现有方法的共同之处。这导致了有用的数学结果,连同在语言学、文化心理学和遗传学的应用,以及基准聚类数据。总之,这些证明了如何在不需要额外输入(例如聚类数量或邻域大小)、优化标准、迭代过程或分布假设的情况下识别有意义的社区结构。


图:利用局部社区深度度量,识别社区的深层结构。



8.快速的回应速率标志着

对话中的社会联系


论文题目:Fast response times signal social connection in conversation

论文来源:PNAS

论文链接:https://www.pnas.org/content/119/4/e2116915119


碰撞是社交联系最有力的隐喻之一。但是怎么知道两个人什么时候“碰撞”呢?我们让成对的朋友和陌生人互相交谈,并评估他们的联系感。不论对于朋友还是陌生人来说,回应速率是联系感的有力预测因素。回应较快的对话比回应较慢的对话带来更紧密的联系感,并且在对话中,联系感较强的时刻比联系感较弱的时刻具有更快的回应。这种影响主要取决于对方的回应速率:人们的联系感与对方回应他们的速率有关,而与他们回应对方的速率无关。这些影响的时间尺度(<250 ms)排除了有意识的控制,从而提供了一个诚实的连接感信号。在六个封闭网络中的每一个中使用循环设计,我们表明更快的回应者唤起了关系之内更大的联系感。最后,我们展示了回应速率能够很好地被对话的第三方用作衡量对话二人联系程度的启发因子:与回应速率较慢的相同对话相比,回应速率较快的对话被认为具有更多的联系。总之,这些发现表明,回应速率构成了两个大脑是否“碰撞”的稳健而充分的信号。


图:回应速率是联系感的有力预测因素。





关于Complexity Express




Complex World, Simple Rules.
复杂世界,简单规则。
由于学科交叉融合,大量针对复杂系统的研究成果散落在人工智能、统计物理、网络科学、数据科学、计算社会科学、生命科学、认知科学等等不同领域的期刊会议中,缺乏整合。

 

为了让大家能及时把握复杂系统领域重要的研究进展,我们隆重推出「Complexity Express」服务,汇总复杂系统相关的最新顶刊论文。

 

Complexity Express 是什么?

Complexity Express 每天爬取复杂系统领域最新发表的顶刊论文,每周通过“集智斑图”服务号汇总推送。
 
进入 Complexity Express 页面即可随时查看顶刊论文更新,你也可以通过微信接收研究更新推送和一周汇总。

               


Complexity Express 为谁服务?

  • 如果你是复杂系统领域的研究者,可获得重要论文上线通知,每周获取最新顶刊论文汇总。

  • 如果你是复杂系统领域的学习者,可了解学界关注的前沿问题,把握专业发展脉络。

  • 如果你是传统的生命科学、社会科学等学科中的研究者/学习者,可以从复杂科学和跨学科研究中获得灵感启发。

  • 如果你是关注前沿研究发现的知识猎手,可获得复杂系统研究对自然和人类世界的最新洞见。

Complexity Express 栏目也是集智俱乐部公众号的主要选题来源,诚挚邀请你订阅,与我们信息同步。
 

Complexity Express 论文从哪里来?

考虑复杂系统研究往往属于跨学科工作,我们主要抓取综合类和泛物理类/计算机类的顶级期刊,从每周新发表的数百篇论文中精选出与复杂系统相关的论文。
 
Complexity Express 参考影响因子和学者口碑,选择了如下期刊,每日爬取其论文更新:
  • Nature

  • Science

  • PNAS

  • Nature Communications

  • Science Advances

  • Physics Reports

  • Physics Review Letters

  • Physics Review X

  • Nature Physics

  • Nature Human Behaviour

  • Nature Machine Intelligence

  • Review of Modern Physics
  • Nature Review Physics
  • Nature Computational Science
  • National Science Review
  • 更多期刊持续增补中,欢迎推荐你认为重要的期刊!
 
如果你在 Complexity Express 中发现了感兴趣的论文,请立刻“点赞”!每周最高赞的论文,集智编辑部将组织专业解读~
 

Complexity Express 追踪哪些领域?

我们力求兼顾热点追踪与领域覆盖,目前筛选的论文主要集中在如下与复杂性关系密切的领域:
  • 复杂系统基本理论
  • 复杂网络方法及应用
  • 图网络与深度学习
  • 计算机建模与仿真
  • 统计物理与复杂系统
  • 量子计算与量子信息
  • 生态系统、进化、生物物理等
  • 系统生物学与合成生物学
  • 计算神经科学与认知神经科学
  • 计算社会科学与社会经济复杂系统
  • 城市科学与人类行为
  • 科学学
  • 计算流行病学
  • 以及一些领域小众,但有趣的工作
 
由于复杂性研究领域横跨多个学科,研究论文散落在不同的期刊上,很难不重不漏地把握最新工作。针对复杂性领域的论文筛选,我们专门设计了算法。经过数月的训练迭代优化,目前对上述领域爬取准确率达到90%以上。
 
将来我们还会根据你的具体研究领域,推出研究分类与个性化的订阅服务,敬请期待!
 
由于复杂性领域涉及的论文关键词和研究问题纷繁复杂,所以算法难免有不成熟的地方,如果你发现我们有漏掉的重要论文,或者爬到了领域有偏差的论文,欢迎联系我们(小助手微信:swarmaAI),帮助我们持续优化算法。

如果你对科学学、计算术语学等感兴趣并有代码能力,欢迎报名成为集智算法志愿者/实习生(具体请邮件联系算法组负责人huqiao@swarma.org)

如果你对复杂科学及相关跨学科研究有长期兴趣,并乐于解读分享,欢迎加入集智作者团队(具体请邮件联系编辑部负责人liupeiyuan@swarma.org)




更多论文




更多复杂性顶刊论文,请到Complexity Express页面查看。订阅即可每周获取更新提醒。
       


点击“阅读原文”,追踪复杂科学顶刊论文