集智斑图顶刊论文速递栏目上线以来,持续收录来自Nature、Science等顶刊的最新论文,追踪复杂系统、网络科学、计算社会科学等领域的前沿进展。现在正式推出订阅功能,每周通过微信服务号「集智斑图」推送论文信息。


扫描下方二维码,关注“集智斑图”服务号,即可订阅Complexity Express:             



Complexity Express 一周论文精选




以下是2022年4月11日-4月17日来自Complexity Express的复杂性科学论文精选。如果Complexity Express列表中有你感兴趣的论文,欢迎点赞推荐,我们会优先组织解读~

目录:

1、根据模型不确定性比较统计推断方法

2、填料堵塞中塑性事件与空间维度局部结构的相关性

3、社会关系预测多维自由放养灵长类社会中的大脑结构

4、体细胞突变率随哺乳动物的寿命而变化

5、利用高分辨率接触网络评估 SARS-CoV-2 在大规模多日事件中的传播和控制

6、基于图神经网络从单细胞 ATAC-seq 数据推断转录因子调控网络

7、森林砍伐引起的气候变化减少了剩余热带森林的碳储存量

8、用无限宽度神经网络进行矩阵补全的简单、快速、灵活框架



1.根据模型不确定性

比较统计推断方法


论文题目:Comparing Methods for Statistical Inference With Model Uncertainty
论文来源:PNAS
论文链接:https://www.pnas.org/doi/full/10.1073/pnas.2120737119

概率模型用于许多统计任务,特别是参数估计、区间估计、模型参数推断、点预测和区间预测。因此,选择一个统计模型并考虑这个选择关联的不确定性是科学研究过程的重要部分。在这里,我们关注包含在线性回归模型中的变量选择问题。已经有包括贝叶斯和惩罚似然方法(penalized likelihood method)在内的许多方法被提出,但不同方法之间少有剖析比较。我们通过密切基于真实数据集的广泛模拟研究,比较了21种最流行的方法,这些数据集涵盖了实际数据分析中遇到的一系列情况。三种自适应贝叶斯模型平均(Bayesian model averaging,BMA)方法在所有统计任务中表现最佳。这些参数使用Zellner的g-prior的自适应版本,其中先验方差参数g是样本大小的函数或根据数据估计。我们发现,对于使用马尔可夫链蒙特卡罗实现的BMA方法,10,000次迭代即接近收敛。在计算上,我们发现三种最佳方法中的两种(g=√n 和 EBlocal的BMA)能够比拟最小绝对值收敛和选择算子模型(LASSO),而LASSO通常因为其计算效率被作为首选的变量选择技术。BMA的表现优于贝叶斯模型选择(其中只选择了一个模型)

图:在横跨不同学科主题的14个真实世界数据集上使用21种变量选择方法,多方面比较模型预测性能与计算消耗。排名前三的三种BMA方法表现最优,且其中g=√n和EBlocal能够在计算效率上比拟作为基准的LASSO方法。



2.堵塞密堆中塑性事件

与空间维度局部结构的相关性


论文题目:Correlation of Plastic Events With Local Structure in Jammed Packings Across Spatial Dimensions
论文来源:PNAS
论文链接:https://www.pnas.org/doi/abs/10.1073/pnas.2119006119

平均场理论在无限维空间极限下是确切的,可以成功描述玻璃和非晶态固体在低维下的许多特征,该理论引导我们理解这类材料的行为如何随维数的变化而演化。到目前为止,所有的证据都支持这样一种说法:在低维中,“局部物理”在低维下贡献了平均场行为的偏差,而随着维数的增加,偏差逐渐消失。具体而言,对于无摩擦堵塞密堆,现有证据表明局部物理在低空间维度 d = 2, 3 中占主导地位,但随着维度的增加迅速失去相关性,取而代之的是空间扩展的平均场行为。例如,准局域化的低能振动模式和与偏离平均场行为相关的低配位粒子都随着维数的增加而迅速消失。这些结果表明,与低能振动模式相关的局部重排与局部结构相关,并且在低维中占主导地位,应该在更高的维数中让位于与局部结构不相关的扩展重排。

在本文中,研究人员使用机器学习来分析在无热、准静态剪切下堵塞密堆的模拟,确定与d=2到d=5的重排相关的局部结构变量柔软度。研究者发现柔软度——甚至只是局部的配位数Z——基本上同样可以预测所有维度研究中的重排。这一结果提供的直接证据表明,局部结构在更高的维度中起着重要作用,在二维和三维系统中与局部结构相关的重排,在五维系统中仍然与局部结构相关,揭示了一幅经过修正的、平均场理论中不同维度之间相互交叉的物理图景。

图:从拟合中提取的相关长度与相关函数的初始指数衰减作为压力的函数。在2d和3d,相关长度差异较大;在 d = 4, 5 时,它们看起来几乎相等。所有相关长度似乎都随着空间维度的增加而减小。黑色,2d;蓝色,3d;绿色,4d;红色,5d。



3.社会关系预测多维自由放养

灵长类社会中的大脑结构


论文题目:Social connections predict brain structure in a multidimensional free-ranging primate society
论文来源:Science Advances
论文链接:https://www.science.org/doi/10.1126/sciadv.abl5794


大多数灵长类动物的繁殖和生存反映了对竞争和合作关系的管理。本篇文章研究了自由放养的恒河猴的脑部解剖结构和社会性之间的联系。在成年猴中发现,社会伙伴的数量可以用来预测颞中上沟(mid-superior temporal sulcus, mid-STS)和腹侧无颗粒脑岛(ventral-dysgranular insula, vd-insula)的体积,而这二者分别与社会决策和移情功能有关。但是未发现成年恒河猴的大脑结构与其社会地位或人际联系等关键的社会性评价变量之间存在联系。另外,幼年恒河猴的大脑结构与母亲的社交网络或社会地位之间也没有联系。这些研究结果表明,特定大脑结构的大小反映社会中直接关系的数量变化,并且这种关联可能在发育过程中出现。该研究结果有力证明了社交网络规模、生物演化的成功和特定神经环路之间的联系。

图:社会网络大小与成年恒河猴个体颞中上沟和腹侧无颗粒脑岛体积呈正相关。(A)展示了所研究恒河猴群体的社会网络结构,其中紫红色圆圈表示雌性,蓝绿色圆圈表示雄性,关系强弱用有向线段的颜色深浅来表征,而每个个体的社交网络大小则通过圆圈大小来直观呈现。(B)和(C)则分别展示了群体中成年个体的左半球MRI结果,研究发现采用亲密性、中间性、中心性(closeness, betweenness, eigenvector centrality)三个指标进行评估社交网络大小与颞中上沟和腹侧无颗粒脑岛的相对体积呈正相关。



4.体细胞突变率

随哺乳动物的寿命而变化


论文题目:Somatic mutation rates scale with lifespan across mammals
论文来源:Nature
论文链接:https://www.nature.com/articles/s41586-022-04618-z

对于人类之外的生物,正常组织中的体细胞突变率和模式很大程度上是未知的。比较分析可以揭示物种间突变的多样性,以及关于体细胞突变率的演化规律及其在癌症和衰老中发挥的作用。我们对56个个体的208个肠隐窝进行了全基因组测序,研究16种哺乳动物的体细胞突变情况。我们发现所有物种的体细胞突变都是由看似内源的突变过程控制的,包括5-甲基胞嘧啶脱氨基和氧化损伤。虽然每个特征的相对贡献因物种而异,但是其他物种的突变特征与人类的相似。值得注意的是,每年的体细胞突变率在不同物种之间差异很大,并且与物种寿命呈强烈的反比关系,没有其他生活史相关的性状的研究显示出相当水平的相关性。尽管我们研究的物种的生命史差异很大,包括寿命差异约30倍、体重变化约40,000倍,但寿命末期的体细胞突变负担只相差3倍。这些数据揭示了哺乳动物中普遍的突变过程,并表明体细胞突变率受到演化的限制,可能是衰老的一个影响因素。

图:不同动物的体细胞突变数目随年龄呈线性增长


5.利用高分辨率接触网络评估

SARS-CoV-2

在大规模多日事件中的传播和控制


论文题目:Using high-resolution contact networks to evaluate SARS-CoV-2 transmission and control in large-scale multi-day events
论文来源:Nature Communications
论文链接:https://www.nature.com/articles/s41467-022-29522-y


随着各国逐步恢复新冠疫情前的各种活动,特别是持续多日的大规模活动这一背景下,高传染性 SARS-CoV-2变种的出现使我们不得不重新评估日益增加的社会接触所带来的疾病风险。为了研究在不同的活动环境中形成的社会接触如何影响控制新冠病毒德尔塔亚型带来的疫情所需干预措施,研究收集了游轮上乘客和船员之间的高分辨率接触数据,并将之与网络传播模型相结合。研究发现,乘客每天的密切接触者数量的中位数为20(四分位距为10-36),其中超过60%的接触事件发生在餐饮或运动场所,这些场所涉及的活动往往无法保证一直佩戴口罩。研究模拟疫情暴发并发现,疫苗接种覆盖率和快速抗原检测的效果比单独使用口罩的效果更好。这表明在疫苗时代,针对德尔塔采取联合干预措施以降低事件风险的重要性。

图:(a)是模拟疫情暴发的效果图,假设其中有一名病例,观察传播情况,观察到7天后平均会感染10个人(四分位距为3-23),而其他人则会在7天后才表现出症状。效果图中的感染病例用放大的节点表示,红色曲线箭头表示疾病传播。(b)则控制了干预措施变量,分别为无干预措施、核酸检测、抗原检测、佩戴口罩和疫苗接种,并展示了五种情况下的暴发规模模拟的比例。(c)的各种颜色曲线表示佩戴口罩与未佩戴口罩情况下,不同疫苗接种覆盖率下,无检测措施、核酸检测和抗原检测三种检测措施的预期暴发规模,可以发现在采用核酸检测或抗原检测的情况下,是否佩戴口罩的差异性不如无检测措施的差异明显。(d)进一步展示了图C中六种情况的95分位数的暴发规模。



6.基于图神经网络

从单细胞ATAC-seq数据

推断转录因子调控网络


论文题目:Inferring transcription factor regulatory networks from single-cell ATAC-seq data based on graph neural networks
论文来源:Nature Machine Intelligence
论文链接:https://www.nature.com/articles/s42256-022-00469-5


序列特异转录因子(Transcription Factor, TF)是真核生物基因控制的关键效应因子,调控成百上千个下游基因。特别有趣的是由一个特定的转录因子调控其他转录因子的相互作用,即转录因子调节网络(TF regulatory network, TRN),这也是细胞身份和主要功能的基础。染色质可及性(Chromatin Accessibility)描述了DNA序列是否在物理上可及,并提供了直接测量转录调节的一种方法。得益于越来越多的染色质可及性数据和深度学习的进展,我们开发了一种名为DeepTFni的计算方法,利用染色质可及性单细胞分析(scATAC-seq)数据推断转录因子调节网络。我们采用了更适用于表示网络的图神经网络(graph neural network),DeepTFni能够通过有限的细胞数出色地完成转录因子调节网络的推断。在实际应用中,DeepTFni帮助我们找到了组织发育和肿瘤发生中的枢纽转录因子,并发现mRNA水平无显著差异的情况下,许多混合表型的急性白血病相关基因转录因子调节网络实际上发生了显著改变。DeepTFni(http://deeptfni.sysomics.com/)易于使用,并为几种主流的细胞系提供了预测的转录因子调节网络。

图:DeepTFni工作流程示意图。(a)展示了DeepTFni将来自 scATAC-seq 数据的峰值与细胞矩阵作为输入,这包括三个步骤。第一步是构建转录因子调节网络骨架,由一组具有最大似然性的转录因子互作(TF-TF interaction, link)组成。推定的转录因子互作定义为某个转录因子结构域出现在另一个转录因子的可及启动子中,并且使用初始邻接矩阵表示转录因子调节网络骨架。第二步是计算每个单元格中每个转录因子的RP节点特征。(b)(c)展示了对于所有生成转录因子调节网络骨架分为非重叠集进行训练和测试。模型训练的第三步首先是将具有所有节点特征的互作输入到 VGAE 模型。(c)中的φ (·) 表示logistic sigmoid 函数,T表示转置操作。(d)是训练输出的新的转录因子调节网络,红色线段表示转录因子互作。理想情况下,输出应该能够还原大部分测试互作并提供新的预测。



7.森林砍伐引起的气候变化

减少了剩余热带森林的碳储存量



论文题目:Deforestation-induced climate change reduces carbon storage in remaining tropical forests
论文来源:Nature Communications
论文链接:https://www.nature.com/articles/s41467-022-29601-0


森林砍伐造成的生物物理效应存在放大碳损失的可能,但目前,这类效应在碳核算系统中经常被忽视。在本文中,研究人员通过地球系统模型模拟及卫星估算得到的地面生物量(aboveground biomass,AGB)来评估热带森林砍伐对不同大陆区域气候的影响所造成的植被碳损失。在亚马逊地区,森林砍伐引起的气候变暖和干旱导致地面生物量额外损失达到5.1±3.7%。生物物理效应也增加了刚果的碳损失(3.8±2.5%),但由于热带亚洲的年平均降水量高,不会导致显著的额外碳损失。这些发现表明,在碳核算系统中,热带森林可能被低估了,忽视了来自地面生物物理变化的气候反馈,森林砍伐驱动的气候变化的碳-气候正反馈高于来自化石燃料排放的反馈。

图:(a-c)显示了毁林引起的气候变化(年平均降水和年平均温度)所造成的生物物理地面生物量变化的估计值,以及地面生物量对降水和温度的观测敏感性,如图2c所示。(d-f)表示(a-c)的相对变化,占毁林造成的地面生物量直接损失估计的百分比


在这项工作中,研究人员结合毁林引起的年平均降雨量和气温变化来估计毁林对地面植被碳储量的生物物理影响,该研究的数据源自一项理想化的全球毁林实验,实验属于耦合模型比对项目第 6 阶段(CMIP6)中的土地利用模型比对项目(LUMIP55),该项目从卫星观测数据中得出气候与地面生物量储存之间的经验关系。该文的分析将生物物理碳成本的相对幅度与三个不同大陆地区(亚马逊、刚果和亚洲热带海洋大陆)的热带森林砍伐造成的直接地面生物量损失进行了比较。研究人员将生物物理碳成本定义为由森林砍伐引起的气候变化导致的额外碳损失。研究人员还报告了碳气候反馈参数 Gamma(定义为地表气温每升高 1°C 时每个位置的累积碳损失),并将仅由热带森林砍伐的生物物理气候效应驱动的Gamma与更传统的、来自于二氧化碳增加的辐射效应所得到的Gamma估计值进行比较。


8.用无限宽度神经网络进行

矩阵补全的简单、快速、灵活框架


论文题目:Simple, fast, and flexible framework for matrix completion with infinite width neural networks
论文来源:PNAS
论文链接:https://www.pnas.org/doi/10.1073/pnas.2115064119


矩阵补全(matrix completion)问题出现在许多应用中,包括推荐系统、计算机视觉和基因组学。在许多这样的应用中使用神经网络都取得了成功,但网络越来越大,计算成本也相当高。值得注意的是,将神经网络的宽度增加到无穷大,可以提高计算性能。在这项工作中,我们开发了一个用于矩阵补全的无限宽度的神经网络框架,它简单、快速、灵活。神经网络的无限宽度极限和神经正切核(neural tangent kernels,NTK)之间的联系使框架具有简单和快速的特点。具体来说,我们推导出全连接神经网络和卷积神经网络的神经正切核,并将这两种神经网络用于矩阵补全。特征先验(feature prior)使网络具有灵活性,它允许对目标矩阵的坐标之间的关系进行编码,这个过程类似于半监督学习。在虚拟药物筛选(virtual drug screening)和图像修补/重建(image inpainting/reconstruction)中得到了不错的结果,证明了框架的有效性。我们还提供了一个Python实现,使我们的框架可以在标准硬件上为广大用户所使用。

图:矩阵补全应用概述,其中(a)、(b)矩阵中的 ? 和 (c)、(d)中的零(黑色)像素表示未观察到的元素。(a)协同过滤示例(Netflix 问题),其目标是预测用户将如何评价(按1-5分的评分)未看过的电影。(b)虚拟药物筛选,其中的问题是预测未观察到的药物/细胞类型组合的基因表达谱。在这个应用中,矩阵的一整列都没有被观察到。(c, d)对重建图像的损坏区域(显示为黑色像素)进行修复和重建。(e) 我们的神经正切核矩阵补全框架很容易适应解决上述所有问题,因为该框架选择了一个表征嵌入应用特定元数据的先验特征。





关于Complexity Express




Complex World, Simple Rules.
复杂世界,简单规则。
由于学科交叉融合,大量针对复杂系统的研究成果散落在人工智能、统计物理、网络科学、数据科学、计算社会科学、生命科学、认知科学等等不同领域的期刊会议中,缺乏整合。

 

为了让大家能及时把握复杂系统领域重要的研究进展,我们隆重推出「Complexity Express」服务,汇总复杂系统相关的最新顶刊论文。

 

Complexity Express 是什么?

Complexity Express 每天爬取复杂系统领域最新发表的顶刊论文,每周通过“集智斑图”服务号汇总推送。
 
进入 Complexity Express 页面即可随时查看顶刊论文更新,你也可以通过微信接收研究更新推送和一周汇总。

               


Complexity Express 为谁服务?

  • 如果你是复杂系统领域的研究者,可获得重要论文上线通知,每周获取最新顶刊论文汇总。

  • 如果你是复杂系统领域的学习者,可了解学界关注的前沿问题,把握专业发展脉络。

  • 如果你是传统的生命科学、社会科学等学科中的研究者/学习者,可以从复杂科学和跨学科研究中获得灵感启发。

  • 如果你是关注前沿研究发现的知识猎手,可获得复杂系统研究对自然和人类世界的最新洞见。

Complexity Express 栏目也是集智俱乐部公众号的主要选题来源,诚挚邀请你订阅,与我们信息同步。
 

Complexity Express 论文从哪里来?

考虑复杂系统研究往往属于跨学科工作,我们主要抓取综合类和泛物理类/计算机类的顶级期刊,从每周新发表的数百篇论文中精选出与复杂系统相关的论文。
 
Complexity Express 参考影响因子和学者口碑,选择了如下期刊,每日爬取其论文更新:
  • Nature

  • Science

  • PNAS

  • Nature Communications

  • Science Advances

  • Physics Reports

  • Physical Review Letters

  • Physical Review X

  • Nature Physics

  • Nature Human Behaviour

  • Nature Machine Intelligence

  • Review of Modern Physics
  • Nature Review Physics
  • Nature Computational Science
  • National Science Review
  • 更多期刊持续增补中,欢迎推荐你认为重要的期刊!
 
如果你在 Complexity Express 中发现了感兴趣的论文,请立刻“点赞”!每周最高赞的论文,集智编辑部将组织专业解读~
 

Complexity Express 追踪哪些领域?

我们力求兼顾热点追踪与领域覆盖,目前筛选的论文主要集中在如下与复杂性关系密切的领域:
  • 复杂系统基本理论
  • 复杂网络方法及应用
  • 图网络与深度学习
  • 计算机建模与仿真
  • 统计物理与复杂系统
  • 量子计算与量子信息
  • 生态系统、进化、生物物理等
  • 系统生物学与合成生物学
  • 计算神经科学与认知神经科学
  • 计算社会科学与社会经济复杂系统
  • 城市科学与人类行为
  • 科学学
  • 计算流行病学
  • 以及一些领域小众,但有趣的工作
 
由于复杂性研究领域横跨多个学科,研究论文散落在不同的期刊上,很难不重不漏地把握最新工作。针对复杂性领域的论文筛选,我们专门设计了算法。经过数月的训练迭代优化,目前对上述领域爬取准确率达到90%以上。
 
将来我们还会根据你的具体研究领域,推出研究分类与个性化的订阅服务,敬请期待!
 
由于复杂性领域涉及的论文关键词和研究问题纷繁复杂,所以算法难免有不成熟的地方,如果你发现我们有漏掉的重要论文,或者爬到了领域有偏差的论文,欢迎联系我们(小助手微信:swarmaAI),帮助我们持续优化算法。

如果你对科学学、计算术语学等感兴趣并有代码能力,欢迎报名成为集智算法志愿者/实习生(具体请邮件联系算法组负责人huqiao@swarma.org)

如果你对复杂科学及相关跨学科研究有长期兴趣,并乐于解读分享,欢迎加入集智作者团队(具体请邮件联系编辑部负责人liupeiyuan@swarma.org)




更多论文




更多复杂性顶刊论文,请到Complexity Express页面查看。订阅即可每周获取更新提醒。
       


点击“阅读原文”,追踪复杂科学顶刊论文