导语


“你比你的数据聪明!”朱迪亚·珀尔教授在他的《为什么》一书中写到,“数据不了解因果,而人类了解…….在计算机时代,这种新的了解也有望被应用于增强人类自身的因果直觉,从而让我们更好地读懂数据,无论是大数据还是小数据”。近年来,越来越多的学者认识到,深度学习遇到了一个难以逾越的瓶颈,对于数据的分析尚未结合其内在的因果关系。而对于因果科学的深度研究,也即将在多个领域掀起新的风暴。



2021年2月24日,由集智俱乐部和智源社区联合发起的因果科学读书会第二季重新起航。第一季因果读书会共有崔鹏、周晓华等老师同学在内的32位讲者为我们分享了多项因果科学前沿研究,并建立了因果社区的雏形。为帮助社区学者将因果推理的方法真正运用到自己的研究中去,中国科学院计算技术研究所直博生李奉治、剑桥大学机器学习组的在读博士陆超超以及香港中文大学(深圳)计算机信息工程在读博士张天健发起了第二季因果科学读书会,第二季因果科学读书会更注重实操性和基础性。


从2021年3月21日到2021年7月24日,既有李昊轩、邓宇昊、李奉治等同学对两本教材的悉心讲解,又有崔鹏、蔡瑞初等老师的前沿分享,还有冯福利、杨梦月等老师同学的应用分享。力求让更多入门学者夯实基础,熟悉理论,了解前沿,能够搭建起理论技术和实际研究的桥梁。


读书会不仅促进了因果科学的讨论思考,还带来了一系列成果:
  • 吸引了超600国内外学者关注,形成了初具规模的因果科学社区。希望可以促进因果科学专业人士和兴趣爱好者们的交流和合作,推进因果科学学术、产业生态的建设和落地,孕育新一代因果科学领域的学术专家和产业创新者。
  • 建立了一系列因果科学学术词条。基于集智百科的平台,本次读书会号召社区老师和同学共同创建因果科学相关术语的学术词条,目前梳理并完善了20个学术词条,其中包括 反事实中介分析结构因果模型干预效应可忽略性 等。集智百科因果科学词条创建目前进入第二阶段,欢迎更多学者参与创建与编辑!
  • 建立了因果社区资料库。通过读书会所建立的社区吸纳了许多优秀的学者,基于社群讨论建立了因果社区的资料库。按照文献推荐、书籍推荐、开源代码、公众号推文和其他推荐分类整理社区资料,方便社区学者查阅和学习。
  • 梳理了因果发现和推断的数据集和算法工具包 因果科学算法、框架、数据集汇总。社区学者总结和梳理了相关的概率编程框架、工具包、数据集及基准,并依此进行分类。
  • 社区科学家北京大学周晓华教授发起了因果科学大会,并且联合华为举办了PCIC 2021华为因果推理挑战赛。社区科学家重庆大学刘礼教授联合CCF发起了因果科学暑期学校。希望这些科研会议和暑期学校的举办吸引更多的学者加入因果社区关注因果科学,发展因果科学。

虽然第二季的读书会已经圆满结束,但是因果社区才刚刚萌芽,我们还会继续在这个主题下不停地探索和讨论,如果你对这个话题感兴趣,并且想要在这个领域有持续的研究和关注,欢迎加入我们!

现在加入「因果科学读书会第二季」可获得如下福利:

1.可以继续免费回看「因果科学读书会第二季」所有的回放。

2.即将开展的因果相关主题的读书会可以免费参与腾讯会议和讨论。

3.在接下来的任何一次因果相关主题读书会内进行分享,符合退费标准均可退费。

4.成为一个高质量社区的种子用户,目前群内已经有600+余名海内外一线的科研工作者和从业者(本季加入了许多海外学者),与大家共同讨论和分享。

报名:(长期有效)


第一步:扫码填写报名信息。

第二步:信息填写之后,进入付款流程,提交保证金299元。(符合退费条件后可退费。)

第三步:添加负责人微信,拉入对应的读书会讨论群。

我们也会对每次分享的内容进行录制,剪辑后发布在集智学园的官网上,供读书会成员回看。




主题介绍




本次分享共邀请了来自海内外不同机构的15位讲者围绕因果科学进行分享,以Causal Inference in Statistics: A PrimerElements of Causal Inference两本书为主线介绍因果科学的基本理论并配合代码实操解决实际问题,同时邀请知名学者进行前沿研究分享和应用实践经验分享。感谢这些讲者带来的精彩的思想和内容!


Causal Inference in Statistics: A Primer一书的分享解读主要被分为四个部分:


第一部分:从宏观角度分析了因果科学的研究意义,巩固了统计学的基础知识,包括变量、概率、条件概率、独立性、全概率公式、贝叶斯法则、多元回归等等,最后初步介绍了结构因果模型的相关概念。


第二部分:从图模型的基础概念出发,介绍了结构因果模型中基础的接合模式,并推导了d-分离这一基础工具,展示它在模型检验和因果搜索上的应用。此部分内容还配备了对应的编程实验,实践了图模型编程和d-分离的实现


第三部分:从干预在实验中的意义出发,整理分析了校正公式、后门准则、前门准则、中介、条件干预、Do演算等知识,展示了它们如何在从观测数据中估计干预的结构。此部分内容也配备了对应的编程实验,实践了后门准则和前门准则的编程实现。


第四部分:从反事实的理论与基础概念出发,系统性分析了其结构性解释、基本定理、图形化表示、概率表示等,并通过例子分析试验环境中的反事实和线性模型中的反事实,以及反事实的在现实研究中的实际应用。


Elements of Causal Inference一书的分享主要作为前一本教材的补充,核心内容包括三个部分:


第一部分:主要介绍了如何基于数据进行因果模型的建模,其中包括了对于高斯或非高斯的加性噪声线性模型与非线性等模型下数据的分析建模,并会学习信息几何因果推理、跟踪方法、监督学习方法等多种分析方法。蔡瑞初、俞奎等老师分享了此方向的前沿研究进展。此部分也配备了对应的编程实验,实践了因果发现PC算法。


第二部分:主要介绍了如何将因果推理结合到机器学习之中,包括半监督学习、协变量偏移、半同胞回归、情景强化学习、迁移学习等。崔鹏老师分享了稳定学习这一前沿应用案例。


第三部分:主要介绍了除结构因果模型之外其他因果模型的基础概念,包括Rubin的潜在因果模型和Granger的因果理论等,分析他们在处理某些类型问题的优势,比较他们与Pearl的结构因果模型框架的异同。陆超超分享了他如何对比潜在因果模型与结构因果模型。


除了书籍的主线内容外,还有耿直老师对于因果科学的总结性分享,以及冯福利、杨帆、杨梦月等分享因果科学在推荐模型、医疗、决策推理等落地应用上发挥的作用。


为提高社群学者参与度和讨论活跃度,本次读书会开展了四次社群内部的夜谈活动,围绕社区中关心的一些重点问题展开自由探讨,让更多社区学者加入讨论,获得了很好的反响!



获取主题分享及参考文献合集,请扫码或者点击“阅读原文“查看路径,如果有相关问题探讨,可以在评论区留言:






第二季成员基础画像




截至2021年7月28日,因果科学读书会第二季共报名322人,具有以下特点:

(点击此链接可以去往第一季看人员基础画像:历时3个月,全球32位讲者,共同讲述因果科学与Causal AI的全景框架!


  1. 参与成员男女比例3:1,较第一季比女性成员比例有所上升。

  2. 参与成员博士比例约45%,硕博比例接近80%,高学历学者占比较高,与第一季基本一致。

  3. 参与人员所在单位以国内外高水平院校和互联网大厂为主,其中包括北京大学、清华大学、同济大学、西安交通大学、中国科学院大学、西湖大学等一流院校,还包括华为、美团等企业。

  4. 参与人员以学生为主,尤其是硕博学生。除了高校学生,还有教授、工程师、高级经理等角色加入社区,为因果科学的研究提供了不同的视角。

  5. 参与人员的专业背景非常丰富,包括计算机、管理科学与工程、数学、生物信息、化学工程、传播学、控制科学与工程等学科。研究兴趣也涵盖了因果推断、机器学习、强化学习、复杂系统、时间序列分析等领域。不同专业背景和不同研究兴趣的社区学者为因果科学的研究注入了更多活力,增强其跨学科研究特性。





主题总览









社区涌现的活动




暑期学校「来临」

第二季因果读书会聚集了全球最前沿的青年学者探讨因果的奥秘,获得了很好的反响,形成了因果社区的种子用户群体,为后续因果社区的发展注入活力和灵魂。为此,8月份,集智俱乐部联合中国计算机学会(CCF)和重庆大学大数据与软件学院举办一期暑期学校,因果社区线上举办,感兴趣的同学可以详细了解:集智俱乐部×重庆大学因果科学暑期学校8月14-17日线上举办,基础+前沿+实践一站习得

泛太平洋因果推断国际大会及因果科学竞赛


PCIC (the Pacific Causal Inference Conference,泛太平洋因果推断大会) 2021将于2021年9月11日至12日在北京以线上+线下相结合的方式举行。本大会聚集了海内外一大批因果科学相关领域的学术大拿汇聚一堂,共同探讨因果科学的新进展,探索新的科研方向,吸引了非常多优秀的科研工作者投身于该领域,推动了因果科学的研究进程。

会议期间会议组委会,北京大学和华为诺亚方舟实验室共同组织了此次因果竞赛。竞赛的数据集为经过抽取脱敏的实际数据或者根据实际场景抽象出来的模拟数据。获奖团队获得现金奖励和证书,并邀请在大会上做技术报告。

对会议和竞赛感兴趣的同学可以详细了解:PCIC 2021华为因果推理挑战赛开放组队报名

“基于社会系统的因果发现”讲习班


BDSC2021前沿讲习班以“社会系统中的因果发现”为主题,将于11月12日举办。讲习班将介绍因果发现相关的相关基础知识,从因果图构建的模型与假设出发,对基于约束的方法、基于因果函数模型的方法和混合型方法这三大类因果关系发现方法进行介绍;并针对因果图在社会调查、社交网络、人口变动分析等领域的应用进行探讨。同时,通过介绍如何使用python语言对典型的因果发现方法进行编程实现,以及使用Tetrad软件实现从数据中自动进行因果图构建的方法。



感兴趣的同学可以详细了解:BDSC2021前沿讲习班 | 社会系统中的因果发现(已延期至11月12日





第三季预告来袭




第三季因果科学读书会将从 Causal Inference: What If 一书出发,共同研读学习潜在因果模型的相关知识。之后将分别解读经济学、社会学、生物学与医学方向的经典论文,共同探究这些领域中应用潜在因果模型解决实际问题的方法论,尝试使用代码进行复现,并探索是否可以使用结合其他因果工具来获得更直观的结果。



推荐阅读



点击“阅读原文”,获取第二季主题论文合集