关键词:基因组相互作用,信息熵,基于熵的制图法,卷积神经网络,细胞聚类和识别




论文题目:Cartography of Genomic Interactions Enables Deep Analysis of Single-Cell Expression Data
论文来源:Nature Communications
论文链接:https://www.nature.com/articles/s41467-023-36383-6


如何从高维和大规模基因表达数据中准确地辨别模式?单细胞基因组学的显著进展提出了大量医学问题,也带来了独特的挑战和机遇。由于基因之间相互交织的关系,高维基因组数据具有内在的复杂性。现有的方法,包括新兴的基于深度学习的方法,在数据处理过程中没有考虑潜在的生物学特征,这极大地影响了数据分析的性能,并阻碍了最大限度地利用最先进的基因组技术。

Nature Communications 这篇文章发展了一种基于熵的制图策略,将高维基因表达数据设计成一种配置的图像格式,称为基因组图,其中明确整合了基因组相互作用。这种独特的制图方法将基因间的相互作用投射到基因图谱的空间配置中,使我们能够提取深层的基因组相互作用特征,并发现数据的潜在区别模式。

结果表明,与现有技术相比,该方法在细胞聚类和识别、基因特征提取、单细胞数据整合、细胞轨迹分析、降维和可视化等多种应用中显著提高了数据分析的准确性。

图1. 利用 Genomap 和 genoNet 对 scRNA-seq 数据进行深度分析。



图2. 来自 Tabula Muris 数据集的100个细胞的基因图谱属于10个不同的类别。


图3. 缺血敏感性数据集的可视化(左肺、食管中部、右脾)。

图4. 以不同技术分析原始脊椎动物资料集的细胞轨迹。


复杂科学最新论文


集智斑图顶刊论文速递栏目上线以来,持续收录来自Nature、Science等顶刊的最新论文,追踪复杂系统、网络科学、计算社会科学等领域的前沿进展。现在正式推出订阅功能,每周通过微信服务号「我的集智」推送论文信息。扫描下方二维码即可一键订阅:




推荐阅读



点击“阅读原文”,追踪复杂科学顶刊论文