关键词:高维分子数据,生物标志物,机器学习,因果科学



论文题目:Improving generalization of machine learning-identified biomarkers using causal modelling with examples from immune receptor diagnostics
论文期刊:Nature Machine Intelligence
论文地址:https://www.nature.com/articles/s42256-023-00781-8


机器学习越来越多地应用于从高维分子数据中发现诊断和预后生物标志物。然而,与实验设计相关的各种因素可能会影响学习可推广和临床适用的诊断能力。本文认为因果视角有助于更好地识别这些挑战,并规范它与机器学习诊断的稳健性和泛化性之间的联系。作为进一步的具体讨论,本文重点研究一个特定的、新建立的高维生物标志物——自适应免疫受体库(AIRRs)。通过模拟,本文阐明了 AIRR 领域的主要生物学和实验因素如何影响这些生物标志物。总之,研究者认为因果建模通过识别变量之间的稳定关系,指导在不同人群之间调整这些关系和变量,从而提高了基于机器学习的生物标志物的稳健性。

图1. 开发基于自适应免疫受体库(AIRR)的诊断。

图2. 实验表明不同因果模型下免疫状态的预测效果。




编译|魏翘楚

大模型与生物医学:

AI + Science第二季读书会启动


详情请见:

大模型与生物医学:AI + Science第二季读书会启动



推荐阅读
1. Cell 长文综述:机器学习如何助力网络生物学
2. 速递:机器学习帮助构建人类肠道微生物群体感应网络
3. Nat. Commun. 速递:蛋白质热力学粗粒化势能的机器学习
4. 张江:第三代人工智能技术基础——从可微分编程到因果推理 | 集智学园全新课程
5加入集智学园VIP,一次性获取集智平台所有内容资源
6. 加入集智,一起复杂!



点击“阅读原文”,报名读书会