关键词:单细胞RNA测序,最优输运理论,神经微分方程,基因调控网络,细胞命运决定,复杂系统动力学建模


论文题目:Reconstructing growth and dynamic trajectories from single-cell transcriptomics data
论文来源:Nature Machine Intelligence
论文链接:https://www.nature.com/articles/s42256-023-00763-w

在细胞科学探究中,了解单个细胞随着时间推移如何生长、分化和变化,是揭示生命奥秘的关键。单细胞RNA测序(scRNA-seq)技术使科学家能够详细分析单个细胞的基因表达情况,从而揭示细胞在不同状态下的动态变化。然而,由于测序过程会破坏细胞,导致无法追踪同一细胞在不同时间点的变化,这给研究细胞的成长轨迹和动态过程带来了挑战。

为了解决这一难题,Nature Machine Intelligence 近期发表的一项研究介绍了一种名为TIGON(Trajectory Inference with Growth via Optimal transport and Neural network,通过最优输运和神经网络生长进行轨迹推断)的新方法,不仅为单细胞转录组数据的动态解析提供了全新的工具,也为深入理解细胞群落的动态变化开辟了新视角。

TIGON 将细胞的动态变化与群落增长整合于统一框架内,采用深度学习与最优输运(optimal transport)理论,精准重建细胞状态转变及增殖过程,并揭示驱动这些变化的基因调控机制。具体而言,首先基于 Wasserstein-Fisher-Rao(WFR)距离构建动态非平衡最优输运模型,并对其进行无量纲化处理,使其能够同时捕捉每个细胞在基因表达空间中的速度和生长率;其次,利用神经微分方程(Neural ODEs)解决动态非平衡最优输运问题,Neural ODEs 能高效模拟连续时间下的动态过程,适用于处理时间序列数据;最后,通过模型获得的细胞速度和生长信息,推断潜在的时间因果基因调控网络,并通过分析生长梯度,识别与细胞生长密切相关的关键基因。

TIGON 突破了传统单细胞动态追踪的瓶颈,提供了高鲁棒性和高准确性的细胞状态转变与增殖预测工具,推动了细胞发育和疾病机制研究的发展,该框架不仅适用于单细胞RNA测序数据,还具备广泛的应用前景,可扩展至其他类型的单细胞数据和复杂系统的动力学建模,对细胞命运的理解和刻画有重要意义。

图1. TIGON的示意图。

a.细胞谱系动态的示意图,包括细胞生长、转变和基因调控网络(GRNs)。b.连续的细胞动态由时间依赖的密度ρ(x,t)描述。时间序列单细胞RNA测序快照的输入在离散时间点生成密度ρ。c.密度ρ由涉及速度v和生长g的偏微分方程控制,这些量由两个神经网络建模。d,e.TIGON的输出和下游分析。d.左上角,速度图,每个点代表一个细胞,颜色表示采集时间,箭头的长度表示速度的大小。右上角,每个细胞的轨迹。左下角,选定细胞或细胞类型的基因调控矩阵。右下角,GRN,其中指向箭头(钝箭头)表示源基因对目标基因的正(负)调控,箭头的宽度表示调控强度。e.左侧,推断的生长值g用颜色表示。红色箭头表示g的梯度,其长度对应于大小。右侧,g的梯度决定了基因对生长变化的贡献。基于梯度最大的基因选择与生长相关的基因。


图2. TIGON在三基因模拟数据集上的表现

图3. TIGON 在谱系追踪数据集上的表现

图4. TIGON 在 EMT 单细胞RNA测序数据集(scRNA-seq )上的表现

图5. TIGON与轨迹推断或增长推断方法在单细胞RNA测序数据集(scRNA-seq )上的比较


王婷 编译



生命复杂性读书会:

生命复杂系统的构成原理


在生物学中心法则的起点,基因作为生命复杂系统的遗传信息载体,在生命周期内稳定存在;而位于中心法则末端的蛋白质,其组织构成和时空变化的复杂性呈指数式增长。随着分子生物学数十年来的突飞猛进,尤其是生命组学(基因组学、转录组学、蛋白质组学和代谢组学等的集合)等领域的日新月异,当代生命科学临近爆发的边缘。如此海量的数据如何帮助我们揭示宇宙中最复杂的物质系统——“人体”的构成原理和设计原理?阐释人类发育、衰老和重大疾病的发生机制?


集智俱乐部联合西湖大学理学院及交叉科学中心讲席教授汤雷翰,国家蛋白质科学中心(北京)副研究员常乘、李杨,香港浸会大学助理教授唐乾元,北京大学前沿交叉学科研究院研究员林一瀚,中国科学院分子细胞科学卓越创新中心博士后唐诗婕,共同发起「生命复杂性:生命复杂系统的构成原理」读书会,从微观细胞尺度、介观组织器官尺度到宏观人体尺度,梳理生命科学领域中的重要问题及重要数据,由生物学家提问,希望促进统计物理、机器学习方法研究者和生命科学研究者之间的深度交流,建立跨学科合作关系,激发新的研究思路和合作项目。读书会从2024年8月6日开始,每周二晚19:00-21:00进行,持续时间预计10-12周。欢迎对这个生命科学、物理学、计算机科学、复杂系统科学深度交叉的前沿领域感兴趣的朋友加入!



详情请见:
生命复杂性读书会:从微观到宏观,多尺度视角探索生命复杂系统的构成原理



推荐阅读
1. Nat. Commun.速递:深度学习识别病理图像中的细胞空间组织
2. 从图神经网络到几何深度学习:AI4Science的下一个颠覆性突破在何处?
3. 拓扑深度学习捕捉数据的高阶关系:信息传递拓扑神经网络概述
4. 张江:第三代人工智能技术基础——从可微分编程到因果推理 | 集智学园全新课程
5. 龙年大运起,学习正当时!解锁集智全站内容,开启新年学习计划

6. 加入集智,一起复杂!



点击“阅读原文”,报名读书会