城市科学视角下的因果发现|周六直播·复杂系统视角的城市科学读书会
导语
你所在的地方,是否遭遇过冰雹、冻雨、雾霾或者是暴风雪?
北半球中纬度的一些地区,经常会受到严寒的冬季天气的影响。科学家们发现了大气环流、海洋表面温度和地形等因素之间的关联,而这些因素的相互作用,导致了极端冬天天气的发生。
在地球科学中,因果发现和因果推断扮演着重要的角色,帮助我们理解自然界中各种现象的原因和关联。同样地,在城市科学中,我们也可以通过因果发现与因果推断,深入研究各种因素之间的关系,更好地理解城市中发生的现象和事件,并为城市规划和管理提供科学依据。
“复杂系统视角下的城市科学”读书会的第九次分享,我们邀请到了李海峰老师以《城市科学视角下的因果发现》为题,在回顾随机对照试验及其假设的基础上,从城市科学的角度介绍因果发现的相关概念和基本假设,并拓展介绍因果发现在地球科学中的经典应用。
集智俱乐部的“城市科学”读书会由北京大学助理教授董磊联合明尼苏达大学助理教授朱递、中南大学地球科学与信息物理学院教授李海峰、北京航空航天大学计算机学院博士寄家豪共同发起,通过对“城市作为复杂系统”的理论、研究方法及应用的分享、讨论和梳理,促进相关领域学者的交流,推动交叉学科间的合作,促进城市科学的发展和研究。本系列读书会线上进行,2023年7月1日开始,每周六晚 20:00-22:00,持续时间预计10周。欢迎对城市科学这一前沿领域有兴趣的朋友报名参与!
分享简介
分享简介
-
第一部分以随机对照试验引入,重点介绍因果发现的基本假设。首先回顾随机对照试验的原则和假设,以及其在应用层面的局限。之后介绍因果发现的任务和表述工具。接着介绍因果发现的基本假设,包括马尔可夫假设、忠实性假设、同一概率分布P可能对应多种图结构、极小性假设、充分性假设等。最后介绍因果发现方法的分类,即满足充分性假设、放松充分性假设以及放松忠实性假设。 -
第二部分介绍反事实的相关知识。首先以英剧《Yes, Minister》经典桥段之外交部危机处理策略引入,介绍反事实的概念。之后介绍Judea Pearl的“因果之梯”,即观测-干预-想象三个层级。最后介绍反事实的整体框架,并重点介绍反事实的假设,即存在性和迭代替换;以及反事实的模型,即非参数化结构方程模型(NPSEM)和最佳完全随机因果解释结构树图(FFRCISTG)。 -
第三部分介绍因果发现在地球科学中的应用。通过对形成东太平洋-西太平洋”沃克环流”的原因、形成北半球中纬度极端冬天天气原因、加利福尼亚海洋生态系统中的海洋温度与鲱鱼、凤尾鱼之间的关系三个安利的介绍,分析因果发现在地球科学中应用的优势和困境。
分享大纲
分享大纲
-
随机试验:不实际的方法 -
因果发现 -
因果发现基本假设 -
因果发现方法分类
二、反事实
-
引入 -
因果之梯 -
Big Picture -
假设 -
模型
三、因果发现在地球科学中的应用
-
Example1:形成东太平洋-西太平洋“沃克环流”的原因 -
Example2:形成北半球中纬度极端冬天天气原因 -
Example3:加利福尼亚海洋生态系统中的海洋温度与鲱鱼、凤尾鱼之间的关系
核心概念
核心概念
-
因果发现 Casual Discovery:即从纯观测数据中发现并获取因果关系,在近几十年来作为基础的数据分析方法在各个学科发挥着重要的作用。 -
因果马尔可夫假设 Causal Markov Assumption:对于具有因果充分性的变量集而言,在已知变量的父亲节点的条件下,如果所有变量与他们的非后裔节点互相条件独立。 -
因果忠诚性假设 Causal Faithfulness Assumption:如果在给定变量集V的前提下,变量vi和vj互相独立或条件独立,那么在由变量及其之间因果依赖关系组成的因果关系网络图G中,vi和vj之间的所有路径被变量集V中合适的变量d-分离 (d-separation)。即通过独立性检验得到的变量之间的独立性,可以直接反映到因果图上。 -
因果充分性假设 Causal Sufficiency Assumption:当变量集V中的任意两个变量的直接原因变量都存在V中时,变量集V就被认为是因果充分的。 -
反事实 Counterfactual:令X和Y是变量集合V中的两个子集,反事实语句“(在情况u下)假如X取x,那么Y可能取到y”可以等价地用数学符号Yx(u)来描述,表明变量集Y对X取x的反应。 -
因果之梯 Ladder of Causation:Judea Pearl提出的一种分类法(也可以称为框架),该分类法回答了“因果推理主体可以做什么”这一问题。因果关系之梯包括三个层级:关联(association)、干预(intervention)和反事实(counterfactual),分别对应逐级复杂的因果问题。 -
最佳完全随机因果解释结构树图 Finest Fully Randomized Causally Interpretable Structure Tree Graph:一种用于因果推断的统计工具。它是在因果关系分析中,通过构建一个树状结构图来描述因果关系的模型;目标是找到一个最佳的因果解释结构树图,它能够在给定的数据集上提供无偏的因果估计,借此来准确地推断出不同变量之间的因果关系,而不受任何偏差的影响。 -
非参数化结构方程模型 Non-parametric Structural Equation Model:NPSEM是一种统计分析方法,用于研究变量之间的关系和因果关系。与传统的参数化结构方程模型不同,非参数化结构方程模型不需要对模型中的潜在变量和参数进行假设和限制。主要优点是能够探索变量之间的复杂关系,帮助研究人员发现潜在的非线性关系、交互作用和因果关系,从而提供更准确和全面的分析结果;缺点是需要更多的样本和计算资源,需要更多的数据来估计模型。
主讲人介绍
主讲人介绍
直播信息
直播信息
参考文献
参考文献
一、反事实
-
Pearl, Judea, and Dana Mackenzie. (2018). The book of why: the new science of cause and effect. Science. https://doi.org/10.1126/science.aau9731
-
Vonk M C, Malekovic N, Bäck T, et al. (2023). Disentangling causality: assumptions in causal discovery and inference[J]. Artificial Intelligence Review. https://doi.org/10.1007/s10462-023-10411-9
二、因果发现在地球科学中的应用
-
Runge J, Bathiany S, Bollt E, et al. (2019). Inferring causation from time series in Earth system sciences[J]. Nature communications. https://doi.org/10.1038/s41467-019-10105-3
因果科学读书会第一季
由集智俱乐部社区成员龚鹤扬、高亦斌和郭瑞东等人共同发起,从2020年8月26日到2021年1月2日,共有崔鹏、周晓华等老师同学在内的32位讲者,分享了32个不同的主题,B站人气累积10万+,来自海内外不同高校或者企业的一线科研工作者273名,因果读书会借助集体智慧,在100多天的时间里,撬动了数十万人次的共同参与,形成了一场因果科学风暴!
详情请见:
城市科学读书会启动