关键词:生物网络,基因调控网络,图神经网络,机器学习



论文题目:Single-cell biological network inference using a heterogeneous graph transformer

论文来源:Nature Communications

论文链接:https://www.nature.com/articles/s41467-023-36559-0


单细胞多组学(Single-cell multi-omics, scMulti-omics)允许同时对多种组学数据进行定量分析,以捕捉复杂的分子机制和细胞异质性的复杂性。现有的工具不能有效地推断不同细胞类型的活性生物网络以及这些网络对外部刺激的反应。


Nature Communications 的这项研究提出了利用单细胞多组学数据进行生物网络推理的算法架构 DeepMAPS。它在一个异构图中对单细胞多组学数据建模,并使用一个 multi-head graph transformer(HGT)在局部和全局上下文中以一种鲁棒的方式学习细胞和基因之间的关系。基准测试结果表明,DeepMAPS 在细胞聚类和生物网络构建方面的表现优于现有工具。它还展示了在肺肿瘤白细胞 CITE-seq 数据和匹配的弥漫性小淋巴细胞淋巴瘤的单细胞 RNA 和单细胞 ATAC 数据中推导细胞类型特异性生物网络上,表现优于其他工具。此外,研究还部署了一个可提供多种功能和可视化的 DeepMAPS 网络服务,以提高单细胞多组学数据分析的可用性和可重复性。


图1. DeepMAPS 的总体框架。从输入的单细胞多组学数据进行细胞聚类和生物基因网络推断,主要包括五个步骤。B 图自编码器结合 HGT(异构图 transformer) 模型。利用整合后的细胞-基因矩阵构建了包含所有细胞(绿色)和基因(紫色)的异质图。HGT 模型在多个子图(以50个子图为例)上进行训练,尽可能多地覆盖整个图中的节点。每个子图模型被训练100轮;因此,整个训练过程迭代5000次。然后将训练好的模型应用到整个图中,学习和更新每个节点的嵌入。在一个 HGT 层中嵌入目标节点的更新过程。上面面板中的红色圆圈表示目标节点,黑色圆圈表示源节点。箭头表示目标节点和源节点之间的连接。彩色矩形表示不同节点的嵌入。在底部图的放大详细过程显示信息传递过程和注意力机制。一个 HGT 层的最终输出是所有节点的节点嵌入更新。


图2. DeepMAPS 在细胞聚类上的表现评价


图3. 在基因关联网络推断任务上,DeepMAPS的性能评价及和其他方法的对比



图神经网络读书会


报名链接:
https://campus.swarma.org/course/1168?from=wechat

推荐阅读

1. 研究速递:图神经网络预测复杂网络中的传播现象
2. 319篇文献、41页综述文章讲述图神经网络用于医疗诊断的前世今生与未来
3. 长文综述:图神经网络的可解释性
4. 《张江·复杂科学前沿27讲》完整上线!
5. 成为集智VIP,解锁全站课程/读书会
6加入集智,一起复杂!


点击“阅读原文”,报名读书会