Science经典论文:如何检测复杂生态系统中的因果关系?

复杂系统要素众多,相互作用复杂,因果关系的推断非常困难,对此有一系列的研究。2012年发表在Science的一篇论文,提出了收敛交叉映射算法,针对复杂生态系统进行因果推断,取得较好效果。本文是对这篇经典论文的解读。
论文题目: Detecting Causality in Complex Ecosystems 论文地址: https://science.sciencemag.org/content/338/6106/496
图 1:2012 年发表在 Science 杂志的经典论文Detecting Causality in Complex Ecosystems,至今被引用近千次
为什么判断复杂系统
中的因果关系很困难
图2:非线性下的伪相关会持续相当长的时间
收敛交叉映射算法:
复杂生态系统中的因果关系模型
收敛交叉映射算法:
复杂生态系统中的因果关系模型
图3:洛仑兹系统中的因果关系,Mx 和 My 分别是x和y在流形 M 上的映射
图4:随着横轴时间L的增加,洛仑兹系统中相关性ρ变大并收敛到1举公鸡打鸣和太阳升起的例子。假设公鸡在小时候,有时半夜鸡叫,有时正午才打鸣,长大后逐渐掌握了太阳升起的时间,打鸣准时了。等公鸡年长,都会根据四季的不同调整打鸣时间了,那时候公鸡就能欺骗收敛交叉映射算法——算法会认为是公鸡打鸣才是太阳升起的原因(因果性存在)。但这显然是荒谬的,由此通过反证法,该例子说明了收敛交叉验证算法能够从相关性之中,找到真正的因果性。
如何区分
因果关系的方向和类型?
如何区分
因果关系的方向和类型?
在简单情况下,因果关系可以分为三类:互为因果,单向因果与共同原因。三者在数据上看起来是很难区分的,但使用收敛交叉映射算法,可以将由共同诱因Z导致X和Y发生变化的情况与X导致Y区分开。
图5:基于渔业数据,用收敛交叉映射算法区分共同因素引起的伪因果研究者使用真实的渔业数据,做了研究,结果如图所示,左边展示的是三种因果关系的示意图,右边是两种鱼X和Y的数量,由于两个变量的交叉相关性ρ并没有随着时间L变化出现收敛,因此可以排除互为因果,单向因果这两种关系,进而得出是由于共同的第三方因素导致了这两个变量的相关。
收敛交叉映射算法还能区分互为因果与单向因果这两种情况,如下图所示:
图6:随着时间的变化,从X到Y和从Y到X的对应不确定都减少,从而推出双向因果
图7:随时间变化,只有X到Y的映射随机性降低,因此是单向的X到Y的因果
更复杂的情况是五个物种组成的生态系统,如下图所示,在该生态系统中,物种1、物种2、物种3相互之间有100%密切的相关性,物种1、物种2、物种3共同作用,分别影响物种4和物种5。
图8:5个物种组成的模拟生态系统中,通过收敛交叉映射算法判断因果关系如果使用因果图(casual diagram)方法,需要根据预设知识,在模型中给出可能存在因果关系是哪些组。而在缺少预先假设时,例如考察物种2和物种4的相互关系,是无法矫正其他物种带来的影响的。但收敛交叉映射算法就可以在无假设的前提下,判断出因果关系。
因果推断研究
助力新一代人工智能
判定因果关系,尤其是在复杂系统和现实环境中,是极其困难的,连诺奖得主提出的格兰杰因果检验,都不能直接检测因果关系,也无法区分单向的与双向的因果关系。因此判断因果关系,要格外地战战兢兢如履薄冰。本文聚焦2012 年 Science 论文,通过和格兰杰因果检验的对比,展示了收敛交叉映射算法在判定因果关系上能力更优。
论文题目: PC-Fairness: A Unified Framework for Measuring Causality-based Fairness 论文地址: https://arxiv.org/abs/1910.12586
论文题目: Feature relevance quantification in explainable AI: A causality problem 论文地址: https://arxiv.org/abs/1910.13413
论文题目: Deep causal representation learning for unsupervised domain adaptation 论文地址: https://arxiv.org/abs/1910.12417
作者:郭瑞东
审校:刘培源
编辑:张爽
推荐阅读

集智俱乐部QQ群|877391004 商务合作及投稿转载|swarma@swarma.org 搜索公众号:集智俱乐部
加入“没有围墙的研究所” 让苹果砸得更猛烈些吧!◆◆◆

原文始发于微信公众号(集智俱乐部):集智





