专题直播:

因果科学和 Causal AI


8月29日(周六),集智俱乐部将在上午和晚间举办集智凯风研读营的专场直播,由6位研究者分享关于因果科学和 Casual AI 的前沿工作。

Judea Pearl 认为当下正在进行一场改变数据科学的新革命 ——“因果革命”。因果革命和以数据为中心的第一次数据科学革命,也就是大数据革命(涉及机器学习,深度学习及其应用,例如Alpha-Go、语音识别、机器翻译、自动驾驶等等 )的不同之处在于,它以科学为中心,涉及从数据到政策、可解释性、机制的泛化,再到一些社会科学中的基础概念归因和公平性, 甚至哲学中的创造性和自由意志 。可以说, 因果革命彻底改变了科学家处理因果问题的方式,形成了一门新学科——因果科学。因果推理和机器学习融合,构建具备果推理能力的 Causal AI 系统,是实现强人工智能的关键步骤。
 
我们希望通过大家的分享和讨论,能够让所有人都由浅入深的了解因果推理这个领域和研究内容,并且能对研究工作有所收益。

上午场3位:
  • 李奉治(中科院计算所),因果科学中的Do-演算相关算法:

  • https://github.com/L-F-Z

  • 况琨(浙江大学计算机科学学院),观察性研究中的因果推断:

    https://kunkuang.github.io

  • 龚鹤扬(中国科技大学),  教会机器因果推理的强人工智能之路:

    https://sites.google.com/view/minituring


晚间场3位:
  • 郭若城(Arizona State University),因果推断和机器学习的融合:

  • https://www.public.asu.edu/~rguo12

  • 黄碧薇(卡耐基梅隆大学),基于观测数据的因果发现及因果关系启发式机器学习:
    https://biweihuang.com
  • 郭启淏(南方科技大学),量子因果


直播时间:
8月29日上午8:30-12:00
8月29日晚间20:30-24:00

详细安排:


直播地址:
扫描二维码,点击“我要听”预约。我们后续会通过大家参加直播(包含直播地址)

 


报告内容简介和安排



分享一:因果科学中的Do-演算相关算法

本次分享将主要介绍 Judea Pearl 的因果理论相关基础知识,包括概率因果模型、因果关系之梯、因果推断引擎、d-分离、Do-演算等概念,并综述当前已有的Do-演算相关的因果推算算法和框架。最后,将结合实际的算法实现经验,解析Do-演算的应用前景。


本次报告的内容大纲如下:

1. Key concepts in Pearl’s theory of causality

 a. Probabilistic Causal Model

 b. three-level hierarchy of causal reasoning

 c. Inference engine

 d. Mediator/Confounder/Collider

 e. d-sepration

 f. Do-calculus

2. Current progress in Do-calculus

 a. ID and IDC algorithm

 b. Identify algorithm

 c. ID* and IDC* algorithm

 d. IDz, usID, and sID algorithm

3. How to implement Do-calculus



分享者:李奉治,中科院计算所直博生,主要研究方向为因果推理在机器学习中的应用。


分享二:观察性研究中的因果推断

因果问题存在于许多领域,如医疗健康、经济、政治科学、数字营销等。一种新的药物是否比旧的药物对某种疾病有更好的疗效?一个新的营销策略是否能提高某种产品的销量?所有这些问题都可以通过因果推理技术来解决。
 
因果推理的标准方法是随机实验,例如我们熟知的 A/B 测试。然而,完全随机化的实验,成本通常很高,甚至不可行。因此,在观察性研究中发展自动统计方法来推断因果效应是非常困难的。在这个分享中,我们提出了一些在现实的大数据场景中面临因果效应估计的一些挑战,包括(1)高维和噪声变量,(2)变量之间相互作用的未知模型结构,和(3)连续/复杂处理变量。为了应对这些挑战,我们提出了以下的算法:
  • Data-Driven Variable Decomposition (D2VD) algorithm
  • Decomposed Representation Counterfactual Regression (DeR-CFR) model
  • Differentiated Confounder Balancing (DCB) algorithm
  • Generative Adversarial De-confounding (GAD) algorithm.
 
相比于当前已有的方法,我们提出的这些算法在观察性研究中可以对因果效应作出更精确和稳健的估计。


分享者:况琨,浙江大学计算机科学与技术学院的助理教授,研究方向因果推理、机器学习、数据挖掘。



分享三:教会机器因果的StrongAI之路

 
我们正在经历的以数据为中心的大数据革命中,机器学习和 AI 取得到了巨大成功,广泛应用在各个领域中,例如Alpha-Go、语音识别、机器翻译、自动驾驶等等,使得人们日益期待发展出强人工智能,却遇到了包括稳健性,可解释性和理解因果关系的三个根本性困难。因果推理和机器学习融合解决这些困难,构建具备果推理能力的 Causal AI 系统,是实现强人工智能的关键步骤。我们首先简单介绍人工智能领域及其因果诉求,然后梳理 Causal AI 的基本框架相关最新发展,最后展示一些对于 Judea  Pearl 及其工作的评价和不同维度的理解。
 
教会机器因果推理的强人工智能之路,对于这么一个宏大和最有趣的难题,因为个人暂时还没有资格来提出什么新见解,所以本次主题分享的主要目的是向大家介绍 Judea Pearl 关于强人工智能的深刻洞见!
 
因此我在分享中会做到:
尽量展示 Judea Pearl 等人的原文说法。
不方便展示的地方尽量给出观点的参考文献和出处。
当然,我也会分享一些个人的主观看法,评价和疑问,期待和大家一起讨论。

分享者:龚鹤扬,中科大在读博士,研究方向为因果推理。

 

分享四:因果推断和机器学习的融合

让我们考虑两种动物,会学人说话的鹦鹉和乌鸦喝水中的乌鸦。我们知道鹦鹉只会模仿人类的语音,却不知道语言的意义。而乌鸦可以认识到放入石子就可以使水面上升这一层因果关系。我们可以把鹦鹉看作是能做 Curve fitting 的机器学习模型而乌鸦看作是体现变量之间因果关系的因果模型。比起问他们谁更聪明,我想更有益的目标是结合他俩的技能,帮助我们解决实际问题。
 
在机器学习已经在很多任务中已经取得成功的今天,我们想回答的问题是:因果推断能否帮助机器学习在一些任务中做得更好, 以及因果推断能否受益于新的机器学习算法?
 
在这次的研讨会中,我会从这两个方面来介绍一些现存的结合因果推断和机器学习的研究方向。在传统的利用观测性数据的因果推断中,很多模型往往通过很强的,可能不能被满足的假设来避免考虑 Hidden confounders。而最近的一些工作中,很多研究人员,包括我们自己发现利用深度学习我们可以弱化这一假设,在因果推断中做得更好。机器学习模型的一些问题也可以利用其背后的因果模型来解决或者缓解。这里的第一个问题是,如何避免神经网络学习到 Spurious correlation?比如在动物图像分类中,骆驼常常出现在沙漠中,如何能避免分类器利用沙漠背景来预测骆驼这个类?在最近的工作中,研究员把对因果关系的限制转化成了优化问题中的正则项,从而达到这一目的。第二个问题是,在使用用户反馈作为标签的机器学习任务中,如何做到利用历史数据准确地对新模型进行线下的评测和优化。在最近的推荐系统和搜索的工作中,人们发现利用产生用户反馈标签的因果图将使我们在这一任务中做得更好。

本次报告的内容大纲如下:

1. Causal effect estimation with machine learning algorithms

a. Introduction to causal effect estimation

b. Machine learning methods for causal effect estimation

i. Causal Forest

ii. Deep learning methods for causal effect estimation

2. Causal machine learning

a. Learning causal features for out-of-distribution generalization

i. Introduction to out-of-distribution generalization

ii. Invariant risk minimization

b. Unbiased interactive machine learning

i. Bias in interactive machine learning

ii. Unbiased learning to rank

iii. Unbiased recommendation



分享者:郭若城,亚利桑那州立大学博士,研究方向为因果推理、机器学习、数据挖掘。


分享五:基于观测数据的因果发现及因果关系启发式机器学习

经验科学和工程学中的很多任务都依赖于潜在的因果信息。这就提出了一个问题:我们如何找到因果关系?传统方法诉诸于随机实验。但是,这通常很耗时间和资源,有时甚至涉及道德问题。例如,基因敲入是用于创建疾病模型的广泛使用的技术。通常,导致疾病的不是单个基因,而是由数十个甚至更多基因组成的网络。要找到导致疾病的基因网络,可能需要进行非常多的实验才能实现,因为寻找替代方法至关重要。幸运的是,关于如何从观测数据中发现因果关系,最近在机器学习和统计方面已经取得了很大的进步。

第二个问题是:因果理解如何对人工智能产生影响?简要来说,因果理解使我们能够以一种可解释和有条理的方式将知识转移到陌生的新情况中。进一步来说,当存在分布变化或隐藏变量导致虚假关联时,我们尝试回答因果信息如何促进机器学习的问题,包括在分类,聚类,时间序列的预测和强化学习的任务中。

在这次分享会中我将着重于这两个问题来和大家探讨。


分享者黄碧薇,卡耐基梅隆大学博士。主要研究领域为因果发现,因果关系启发式机器学习,和计算神经科学。


分享六:量子因果


作为20世纪上叶物理学的两大革命,相对论物理学与量子力学带来人类对世界的全新认知,其中也包括对因果关系的重新思考。基于这两大革命的量子信息论带来了全新的因果关系——未定因果序(Indefinite Causal Order),并与2017年首次得到证实。本次分享讲介绍物理学中因果的基本观念,未定因果序对经典因果关系的违背以及应用。最后我们介绍诺贝尓物理学奖得主 Wilczek 引入的纠缠态历史这一概念,并分析了其与量子因果理论的异同。


本次报告的大纲如下:

1.Causality in Special Relativity

2.Classical Causal Model and Quantum Causal Model

3.Process Matrix and Indefinite Causal Order

4.Causality Violation in a Non-local Quantum Game

5.Quantum Switch

6.Entangled History

 

分享者:郭启淏,南方科技大学科研助理,从事方向为量子计算的物理实现、基于超导量子电路的量子模拟及量子纠错。



以上参考文献以及研读营的主题的相关参考文献,可以扫码获取:


 

因果科学与 Casual AI 读书会


前几天,我们也推出了因果科学与 Causal AI 系列读书会,也收到一些专业领域老师的反馈,新增补了一部分重要文献:


因果发现

 
  • Huang, Biwei, et al. “Causal discovery from heterogeneous/nonstationary data.” Journal of Machine Learning Research 21.89 (2020): 1-53.

    简介:唯一关于基于独立变更原理从非平稳或多域数据中发现因果关系的论文,不变性是独立变更原理的一个非常严格的特殊情况。

  • Zhang, Kun, and Aapo Hyvarinen. “On the identifiability of the post-nonlinear causal model.” arXiv preprint arXiv:1205.2599 (2012).

    简介:函数因果模型识别问题的 start-of-the-art.

  • Cai, Ruichu, et al. “Triad Constraints for Learning Causal Structure of Latent Variables.” Advances in Neural Information Processing Systems. 2019.

    简介:向学习带隐变量因果图结构迈出了一大步。

  • Zhang, Kun, et al. “Learning causality and causality-related learning: some recent progress.” National science review 5.1 (2018): 26-29.

    简介:这是一篇关于非常精简和高屋建瓴的因果发现综述论文,该论文中总结了许多未解决的问题。“Causal discovery and inference: concepts and recent methodological advances” 是一篇它的评论文章。



领域适应/迁移学习 + 因果推理


  • Zhang, Kun, et al. “Domain adaptation under target and conditional shift.” International Conference on Machine Learning. 2013.

    简介:关于因果关系和领域适应之间的联系的第一批论文之一

  • Zhang, Kun, et al. “Domain Adaptation As a Problem of Inference on Graphical Models.” arXiv preprint arXiv:2002.03278 (2020).

    简介:通过学习分布变化性的图表示并将领域适应视为推理问题,进行域适应或迁移学习的端到端框架;它表明不变性只是一个特例,即使没有不变性,迁移学习也可以非常成功。


为期2个月的因果科学与 Casual AI 读书会正在报名阶段,已经有不少学术界和工业界的研究人员报名参与。本次读书会采用保证金的方式付费参与,参与者有足够的输出即可享受退费。
 
读书会详情与报名方式请点击下方链接查看:
因果科学与 Causal AI 系列读书会 | 众包出书

让我们迈进因果科学的大门!



推荐阅读


因果科学:连接统计学、机器学习与自动推理的新兴交叉领域

为了研究因果关系,原来科学家在这么多方向上都有尝试

网络、几何与机器学习 | 集智-凯风研读营2018

加入集智,一起复杂!






集智俱乐部QQ群|877391004

商务合作及投稿转载|swarma@swarma.org

◆ ◆ 

搜索公众号:集智俱乐部


加入“没有围墙的研究所”

让苹果砸得更猛烈些吧!


👇点击“阅读原文”,报名凯风研读营专题直播