大脑是已知宇宙中最复杂的系统,展示了大量涌现现象。要全面了解大脑,需要对多尺度和水平下的神经组织进行综合描述。这意味着研究基因和突触之间的相互作用,大脑结构和动力学之间的关系,这种关系最终导致不同类型的行为,从感知到行动,从睡眠到清醒。
然而多尺度的大脑模型构建极具挑战,一部分原因是难以同时获取多尺度和水平下的大脑信息。研究者们致力于利用源自网络科学及复杂系统理论的新框架,来构建大脑网络组织的多尺度模型。近日发表于 Reviews of Modern Physics 的一篇综述文章介绍了神经元群高阶组织的多层网络特征,从结构-功能、振荡频率、时间演化三个方面介绍多尺度脑组织表征的最新进展。
研究领域:脑科学,多尺度建模,多层网络,复杂系统
梁栋栋 | 作者
梁金 | 审校
邓一雪 | 编辑
论文题目:
Colloquium: Multiscale modeling of brain network organization
https://journals.aps.org/rmp/abstract/10.1103/RevModPhys.94.031002
人类大脑是已知最复杂的系统之一,强烈地吸引着科学家去理解和探索。在过去二十年里,大型脑项目的数量显著增加:人类脑计划(Human Brain Project)、脑倡议(Brain Initiative)以及中国脑计划(China Brain Project )等。
大脑是一个复杂的系统,它展示了大量涌现现象,例如临界性,这些现象最终支配着许多生物的行为。而这些现象涉及到多个空间尺度,从分子水平到单个神经元,神经元群再到各个脑区,最终是整个大脑。同时还涉及到不同的时间尺度,从亚毫秒级到整个生命周期。
不同尺度也受限于人类现有工具采集到的数据。比如,光学成像、脑电图(EEG)、脑磁图(MEG)、功能磁共振成像(fMRI),这些数据常用来构建动态的脑功能网络。解剖性的脑网络通常来源于死后束追踪(postmortem tract tracing)或体内、体外结构成像技术:弥散张量成像(DTI,diffusion tensor imaging)。
光学成像,例如功能性近红外光谱(fNIRS),其空间分辨率可以达到毫米量级,但时间分辨率往往在秒量级。EEG和MEG的时间分辨率可以达到毫秒量级,但空间分辨率大约在厘米量级。BOLD fMRI的空间分辨率上至整个大脑,下至小于1毫米,而时间分辨率通常是几秒钟到一两分钟。这些数据的时间、空间分辨率各不相同,适用于不同尺度下大脑活动的数据采集。各种采集方式有各自的优势和不足,综合各个尺度下采集的数据进行分析,有助于我们进一步理解大脑活动的规律。
所以全面地了解大脑,需要我们对多尺度和不同层次的神经组织进行综合的描述。然而多尺度的大脑模型构建极具挑战,一部分原因是难以同时获取多尺度和水平下的大脑信息。与此同时,研究者们虽然已经对特定环路会对宏观脑活动产生影响有了一定的认识,但具体到一个尺度和水平下的改变如何对其它尺度和水平产生影响,对这种全面表征仍然知之甚少。
最近研究者们致力于利用源于网络科学以及复杂系统理论的新框架,来尝试解决上面提到的问题。这些理论提供了一个强有力的框架,用来分析和构建包含相互作用的系统模型,这些系统展示了各个信息层之间以及内部的相互作用。
在神经科学中,多尺度建模考虑单个神经元活动到宏观集体动力学行为的多个层次。这些都是依赖于结合神经元动力学中的生物物理力学模型和实验神经成像数据这二者而实现的。这种自下而上的方法允许人们通过小尺度下整合的信息来对宏观观测值进行预测,而这都是在平均场近似的假设下构建的。
平均场近似产生于统计力学中,同时广泛应用在神经科学、人工智能之中。它是一种研究复杂多体问题的方法,是对大且复杂的随机模型的一种简化,未简化前的系统常常包含巨大数目的含相互作用的小个体,平均场近似做了这样的近似:对某个独立小个体,其他所有小个体对其产生的作用可以用一个平均的量给出,如此,简化后的模型成为一个单体问题。
在神经科学中,科学家试图通过常微分方程或者偏微分方程的封闭形式,来描述具有相似特征的神经元群的粗粒度动力学,平均场近似则化身成为第一个介观方程,在这个方程中,由不同类型的神经块构成的网络则为近似大脑活动的宏观动力学提供了基础,其中最早成功的范例之一就是著名的神经元相互作用模型——Wilson–Cowan 模型,和耦合非线性振子模型——Kuramoto 模型,感兴趣的读者可自行查阅原文引文[24,46,88-91]。
图2:自下而上的层次建模。(a)所谓的K-集层次结构,展示从细胞水平到全脑水平的模型进程
在平均场近似假设下构建的多层网络模型,包含着无法从等效聚合版本的网络(比如将跨层的连接直接平均)中获得,也无法从标准的网络指标和工具中获得。这表明我们牺牲对应的单层投影平均网络的简单性是有意义的,构建多层功能性结构网络的好处的详细解释可见原文引文[Zanin, 2015]。于此同时提出新的概念和方法来量化多层网络中出现的高阶拓扑特性也是至关重要的。
图3:多层网络的主要结构。(a)完整的多层网络(Full multilayer network);(b)多路复用网络(Multiplex network);(c)时效网络(Temporal network)
文章向我们展示了三种常用的多层网络结构,如图3所示。图(a)表示的是,例如EEG数据通过滤波,得到α、β、γ三个频段的序列,在不同频段内构建网络形成一层,各层之间的连接并没有特别的限制,这种网络更多整合的是和跨频域耦合相关的信息。图(b)则是利用三种不同的数据源分别构建一层网络,而网络之间的连接仅仅限于复用的节点(映射同一个脑区)之间。图(c)表示的时效网络则重点关注于序列在时域上的变化,例如在EEG数据中,选取不同时间窗内的序列构建单层内的网络,不同时间窗之间则形成了多层间的连接,它同样规定层间连接仅限于复用的节点。
在数学上,这三种网络都可以简单的用一个超邻接矩阵,即表示。三种不同网络的区别也就体现在超邻接矩阵中,A中对角线是层内邻接矩阵,剩余元素为层间邻接矩阵。多路复用网络的超邻接矩阵的非对角线元素均为单位矩阵I,而时效网络的非对角元素,除了相邻时间窗之间是单位矩阵I,其余均为0。网路构建的详细细节,读者可自行查阅原文及相关资料。
构建多层脑网络相较于标准网络方法确实提供了更丰富的描述,但是它们真的能够代表向大脑组织建模迈进了一步吗?为什么聚合的单层网络是不够的?在获得主要的大脑组织特征的过程中层数是越多越好吗,每一层都是必须的吗?De Domenico, Nicosia等人(2015)通过引入一种结构约化方法给出了答案,该方法可以最大化多层网络各层之间的非冗余拓扑信息的数量。
图4:(a)多频脑网络的结构可约性。(b)从 fMRI 数据构建的多频脑网络中获得的健康受试者质量函数的中位数随着网络层数的变化。
构建了上述三种多层网络之后,分析工具必不可少。作者分别通过微尺度(节点)、中尺度(集群)、大尺度(全网络)三个不同的拓扑尺度,来介绍对应的分析工具。
对节点的特征描述,非常经典的就是度值(degree),在多层网络中,比较流行的指标是:多路复用参与系数(multiplex participation coefficient),用p表示,该系数主要衡量的是节点的连接在各层的分布情况,如果平均分布在每层,则 pi=1,如果集中在一层,pi=0。
在网络中,互联节点形成的三元组(triangle)是支持网络传递、集群、信息隔离最基础的配置。局部的这种趋势常用聚类系数(clustering coefficient)来衡量,对于给定节点,它衡量连接到给定节点的节点之间也互联的比例,层间的三元组也考虑在内。
这两个指标确定哪些节点是网络中最中心的节点。也有别的方法来进行评价,比如,基于最短距离的计算,一个节点的介数(betweenness)用来衡量其在拓扑结构上连接远处部分的能力。扩展到多路复用网络中,叫做重叠介数中心性(overlapping betweenness centrality)。
还有一个中心性的测量指标 PageRank,它最初用于谷歌页面搜索引擎。它的中心性可以理解为在网络中的一个随机漫步者会访问各个连接,在一个节点(即页面)上花费的时间比例越高,说明中心性越强。以上四个指标的详细介绍和数学计算,读者可以自行查看原文。
对于中尺度(集群)上特征的定量评价,就需要提到网络基序(Motif)的概念,它简单来说就是包含少量节点的、种类有限的循环连接的模式(pattern)。它们也可以理解为构建复杂系统的基本模块。在多层网络中,基序可以由不同层之间的连接形成,因此,可能构型的总数和层数以及相互作用的类型(正的或负的)都有关系。而Z分数通常用于确定一个多层网络基序G的统计丰度值:。F表示一个给定基序G的出现频率,FR表示平均频率,SR表示标准差,这二者从一组等价的随机多层网络R中获得。
在大脑模块化以及按照隔离方式处理信息的假设下,检测这些连接紧密的模块,即社团检测(community detection)也是非常重要的。所以我们在社团检测的时候,需要考虑如何划分是最优的,而最开始的考虑是社团内连接数越大越好,社团间连接越少越好,可是这样的策略得出的结果没有意义,显然的最优结果就是全部节点在一个社团然后另一个为空社团。之后的策略是,通过和一个随机连接的空模型(也就是我们对一个社团连接个数的期望值)进行比较,这样一来社团连接个数就有可能显著多于期望值或者少于期望值,这样的结果是包含了信息的。这从数学上可以理解为一个优化问题,优化指标为Q,通过启发式的算法最大化Q,就能够给出每一层的最优网络划分。
大尺度上(整个网络)的网络特征通常是通过聚合小尺度上的信息得到。例如,网络的全局效率(global efficiency)就是由其最短路径的长度(通过标量来衡量网络集成远处节点信息的能力)得出。对于多层网络,则可以通过重叠局部效率(overlapping local efficiency)来量化网络形成集群的全局趋势:。这个基于拓扑距离的指标被拓展到时效网络中,他们引入这个度量C来量化在t时刻节点的邻居集在t+1时刻也出现的概率。通过平均所有节点,他们最终定义了时间相关系数C:。
上述部分介绍了脑多层网络的构建以及相关指标的设计,如何结合脑组织的生理结构和功能信息对结果进行合理的解释和利用呢?在解释结果方面,有两个问题需要我们注意。其一是大脑的结构网络和功能网络之间的关系是什么?其二是如何在脑网络中解释大脑存在的信息分离和整合以及之间的关系?
大脑的结构和功能都是认知、知觉、意识等复杂神经现象的关键决定因素。现代神经科学中一个重要的问题就是,结构连接和功能连接之间是如何相互联系的,以及这种这种假定如何帮助我们更好的理解大脑组织。最近基于模型和数据驱动的方法给出自己的看法:功能层面的连接可以通过结构连接预测,并且这种预测可以解释大脑的几种复杂状态,从静息态到基于任务和病理状态。那么利用DTI以及fMRI构建的多层网络的高阶拓扑特性是什么?它们如何帮助描述大脑的解剖功能组织呢?Battiston et al. (2017) 给出了自己的看法,读者可以自行了解,文中作者研究DTI-fMRI多路复用网络的简单连接基序(motif),并得出包含结构连接和正相关功能连接的基序在人脑中是过多的。结果可见图5。
图5:(a)结构-功能两层脑网络。两层间重复节点的连接为了可视化而省略。Z分数显示了与等效的随机网络相比,被过度代表和被不充分代表的基序。
图5的结果证实了解剖上结构连接的存在会诱发相应大脑区域之间的同步活动。但是,与此同时,其它重要的报告显示功能层上存在的三角基序并没有结构层上的支持。这说明大脑内在功能组织并非完全受底层解剖网络的简单限制。
第二个方面即信息的分离与整合的描述。长久以来,有两种对大脑功能的观点长期对立。一方面是基于颅相学(phrenology-based)的理论,它将不同的认知任务与分离的大脑区域联系起来。另一方面是全局工作空间理论,它假设需要跨越区域整合信息来实现相同的任务。网络科学则通过证明社团内多连接以及社团间少数的最短路径,来说明信息的分离和整合。通过考虑多层网络,信息分离和整合成为了节点和层的共同属性,从而提供有关高阶现象的信息,比如跨频耦合(cross-frequency coupling)、多模态信息(multimodal information)、时间演化(temporal evolution)等。以下通过DTI-fMRI两层脑网络的示例说明信息的整合与分离,见图6。
图6:人类连接体的DTI-fMRI多路复用核心-外围结构(Multiplex core-periphery structure)。X、Y轴表示功能层(fMRI)和结构层(DTI)中的单层核心-外围网络结构,Z轴表示多层网络的核心-外围结构。标签说明不能通过单独观察结构层或者功能层来预测多路复用核心-外围结构的大脑区域。
当我们能够构建、评价、解释多层脑网络之后,如何帮助临床对神经系统类疾病进行诊断评价呢?多层脑网络是进行神经疾病诊断评价的全新视角,对健康被试和阿尔茨海默患者的脑网络的空间分布等特征进行比较,可以对疾病的发展进程进行监视,并提供可能的新的治疗方法来缓解疾病的影响,从脑多层网络的视角提出合理的生物标志物(biomarker)是有意义的。
阿尔茨海默病(AD)是一种神经退行性疾病,是最常见的痴呆症形式。临床表现为轻度记忆障碍,逐渐发展为严重认知障碍,最终会导致死亡。目前,在细胞水平上的假说是,阿尔茨海默病通过τ tangles和β-淀粉样斑块的逐步积累,导致了神经元和突触的死亡,从而导致脑萎缩和无序的断开模式。多路复用脑网络对阿尔茨海默病患者大脑的跨频重组进行了描述,细节可见图7。而在其它的精神疾病中,如精神分裂症,依靠脑组织多层网络提出的生物标志物,读者可自行查看原文。
图7:阿尔茨海默病(AD)患者脑网络的多频段和时间重组。(a)由不同频率段得到的网络层,时间网络是由不同频段内的特定时间段的网络串联起来。(b)上图显示了AD患者脑磁图多频网络的中枢中断(hub disruption),每一个点表示一个脑区,指标是上述提到的重叠度(overlap degree)。下图是对应的重叠加权度组间差异显著的脑区。(c)散点图表示将时效网络中提取的多重聚类系数(MCC)和多重参与系数(MPC)合并后,每个被试与AD或对照组之间的马氏距离。
多尺度网络的生成模型。大脑网络的生成模型允许人们从描述性的自上而下方法转向机制性的自下而上方法。这些模型通常定义一组局部连接规则(如概率重布线或优先连接),以发展具有特定全局特性(如小世界或无标度分布)的合成网络。神经科学中的网络模型主要是由生物学和拓扑学的证据或假设来驱动的。
多层网络的可控性。理解一个复杂的系统意味着能够描述它,再现它,并最终控制它。在过去十年中,应用于大脑连接的网络控制理论的发展使得范式发生了转变,为理解大脑如何控制自身以及如何被外生事件控制提供了新的工具(Tang和Bassett, 2018)。
机器学习和多层网络。网络科学能够很好的用于分析和建模复杂系统、揭示机制、解释功能。然而,仅靠网络理论往往不能有效地操纵大型数据集以及不同的分辨率水平。它关注于特定的手工构建的拓扑特性,而忽略了不那么直观但可能存在的代表性模式,例如高阶网络的交互。在这方面,机器学习代表了一种强大的技术,用于处理大量数据,并从数据本身学习与系统固有现象相关的隐藏模式。
跨尺度、跨层次的涌现是复杂系统研究的关键问题,生命起源和意识起源这两座仰之弥高的大山是其代表。而因果涌现理论、机器学习重整化技术、自指动力学等近年来新兴的理论与工具,有望破解复杂系统的涌现规律。同时,新兴的因果表示学习、量子因果等领域也将为因果涌现研究注入新鲜血液。
由北京师范大学教授、集智俱乐部创始人张江和加州大学圣地亚哥分校助理教授尤亦庄等人发起的「因果涌现」系列读书会第二季,将组织对本话题感兴趣的朋友,深入研读相关文献,激发科研灵感。本读书会自2022年5月22日开始,每周日晚19:00举办,预计持续7-8周。欢迎感兴趣的朋友报名参与。
本季读书会详情与报名方式请参考:
因果、涌现与机器学习:因果涌现读书会第二季启动
随着对现实世界探索的不断深入,人们发现在许多真实的复杂系统中,组成系统的个体之间不仅存在二元交互关系,也广泛存在多个体同时(或以特定顺序)进行交互,即高阶交互现象。为此,研究人员分别发展出了基于超图、单纯复形、依赖关系等的网络高阶表示模型,为复杂网络分析和研究提供了新的思路。为了促进此领域的交流与合作,我们发起了【高阶网络读书会】。
集智俱乐部读书会是面向广大科研工作者的系列论文研读活动,其目的是共同深入学习探讨某个科学议题,激发科研灵感,促进科研合作。【高阶网络读书会】由电子科技大学吕琳媛老师、任晓龙老师及中国地质大学(北京)管青老师联合发起,每周分享时间为每周四 19:30-21:30 进行,预计持续 10-12 周。这其间,我们将围绕高阶交互网络的基本概念、模型、方法与应用等研究进行研讨,本次读书会分享会按照「基础理论」+「深入理论」+「案例研讨」的模式展开。