连接因果科学与深度学习的桥梁:因果表征学习读书会启动

导语
随着“因果革命”在人工智能与大数据领域徐徐展开,作为连接因果科学与深度学习桥梁的因果表征学习,成为备受关注的前沿方向。以往的深度表征学习在数据降维中保留信息并过滤噪音,新兴的因果科学则形成了因果推理与发现的一系列方法。随着二者结合,因果表征学习有望催生更强大的新一代AI。
集智俱乐部组织以“因果表征学习”为主题、为期十周的读书会,聚焦因果科学相关问题,共学共研相关文献。读书会自2022年12月27日开始,每周六晚20:00线上举行。欢迎从事因果科学、人工智能与复杂系统等相关研究领域,或对因果表征学习的理论与应用感兴趣的各界朋友报名参与。集智俱乐部已经组织三季“因果科学”读书会,形成了超过千人的因果科学社区,因果表征学习读书会是其第四季,现在加入读书会即可参与因果社区各类线上线下交流合作。

读书会摘要
读书会摘要
因果表征学习,即从低水平的观察中发现高水平的因果变量。因果表征学习就是连接因果科学、机器学习与复杂系统的桥梁,解决因果表征学习及相关问题,就可以很好的将因果推断与机器学习结合起来,构建下一代更强大的AI。并且因果表征学习作为因果科学的前沿方法,与复杂系统中的因果涌现问题有异曲同工之妙,是研究复杂系统中涌现问题的重要方法之一,涌现是从微观到宏观的产生过程, 这与因果表征学习恰好对应。因果表征学习也是一个从微观到宏观的学习过程,它从一些微观的信息(比如图像或者音频) 中可以学到宏观的、可解释的因果变量,这也有望解决复杂系统中定量刻画涌现现象等问题。
读书会背景
读书会背景
近十年深度学习迅猛发展,但是仍有许多问题亟待解决,例如将知识迁移到新问题上的能力。许多关键问题都可以归结为OOD(out-of-distribution)问题。因为统计学习模型需要独立同分布(i.i.d.)假设,若测试数据与训练数据来自不同的分布,统计学习模型往往会出错。然而在很多情况下,i.i.d.的假设是不成立的。
表征学习(Representation Learning)是机器学习中的重要问题,良好的表征是机器学习算法成功的重要条件;正因如此,近十年来深度学习借助神经网络强大的表达能力、海量的数据以及强大的算力,自动地从数据中学习表征,取代了传统的人工制作的特征,取得了瞩目的成就。
因果推断所研究的正是这样的情形:如何学习一个可以在不同分布下工作、蕴含因果机制的因果模型 (Causal Model),并使用因果模型进行干预或反事实推断。然而现实没有这么容易。因果模型往往处理的是结构化的数据,并不能处理机器学习中常见的高维的低层次的原始数据,例如图像。
自然地,是否会有一种方法可以将图像这样的原始数据转化为可用于因果模型的结构化变量,从而能将因果推断和深度学习的优势更好的结合起来?
因果表征学习应运而生,这是一个非常新兴且前沿的研究方向,也是机器学习和人工智能的基本问题之一,它在解决机器学习和人工智能中两个长期未解决的问题:可解释性和可泛化性方面起着关键作用。
但同时也面临着很大的挑战,如何能更好的将因果关系和机器学习结合,将因果表征学习更好的应用于实际的复杂系统中,为具体的决策提供科学依据,构建下一代更通用的AI,是本次读书会中希望去探讨的重要问题。

图片来源@The DIKW Pyramid (Data, Information, Knowledge, Wisdom)
读书会概览
读书会概览
本次读书会围绕更好的梳理因果表征学习的相关问题出发,从因果表征学习的理论基础、技术框架,到因果表征学习最新的前沿应用,包括但不限于因果生成模型、因果可解释性、因果公平性等问题,以及因果在工业界中的具体的落地中去深度探讨,更好的梳理因果表征学习这个领域并促进相关的研究。

发起人团队介绍
发起人团队介绍

李昊轩,北京大学大数据科学研究中心,数据科学 (统计学) 方向博士研究生。研究兴趣为因果推断与机器学习,推荐系统去偏与公平性,强化学习离轨策略的评估和学习,分布外泛化和数据融合问题等。获北京大学博士研究生校长奖学金,已在 ICLR、KDD、WWW、AAAI、IJCAI 等多个顶尖会议发表文章,现为NeurIPS、AAAI、WWW 等Program Committee members (PC)。

陆超超,剑桥大学机器学习组博士。他的主要研究兴趣是机器学习,特别是涉及到如何结合因果推理、贝叶斯推理、强化学习和深度学习各自的优势,并将它们应用在现实领域中解决实际问题,如计算机视觉和医疗等领域。

李奉治,中国科学院计算技术研究所博士生,主要研究方向为并行与分布式计算,以及因果科学在代码知识构建和算力系统调控中的应用。

龚鹤扬,中国科学技术大学统计学博士,研究方向是因果推断。目前就职于快手,研究推荐系统中因果推断的应用实践,专注将因果技术落地个性化激励场景。
报名参与读书会
报名参与读书会
本读书会适合参与的对象
-
基于因果科学与人工智能相关学科研究,对CausalAI,特别是CausalAI研究中的模型、方法有浓厚兴趣的一线科研工作者;
-
能基于读书会所列主题和文献进行深入探讨,可提供适合的文献和主题的朋友;
-
能熟练阅读英文文献,并对复杂科学充满激情,对世界的本质充满好奇的探索者;
-
想锻炼自己科研能力或者有出国留学计划的高年级本科生及研究生。
运行模式
每周进行线上会议,由 1-2 名读书会成员以PPT讲解的形式领读相关论文,与会者可以广泛参与讨论,会后可以获得视频回放持续学习。
举办时间
-
从 2022 年 12 月 27 日开始,每周六晚上 20:00-22:00,持续时间预计10 周。我们也会对每次分享的内容进行录制,剪辑后发布在集智斑图网站上,供读书会成员回看,因此报名的成员可以根据自己的时间自由安排学习时间。
-
自活动举办后任一时间均可加入,在活动结束后加入将无法享受直播权益,其他权益不变。
参与方式
此次读书会为线上闭门读书会,采用的会议软件是腾讯会议(请提前下载安装)。在扫码完成报名并添加负责人微信后,负责人会将您拉入交流社区(微信群),入群后告知具体的会议号码。
报名方式

本读书会可开发票,请联系相关负责人沟通详情。
针对学生的退费机制
读书会通过共学共研的机制,围绕前沿主题进行内容梳理和沉淀,所以针对于学生,可以通过参与共创任务,获取积分,积分达到退费标准之后,可以直接退费。
加入社区后可以获得的资源:
-
在线会议室沉浸式讨论:与主讲人即时讨论交流
-
交互式播放器高效回看:快速定位主讲人提到的术语、论文、大纲、讨论等重要时间点
-
高质量的主题微信社群:硕博比例超过80%的成员微信社区,闭门夜谈和交流
-
超多学习资源随手可得:从不同尺度记录主题下的路径、词条、前沿解读、算法、学者等
-
参与社区内容共创任务:读书会笔记、百科词条、公众号文章、论文解读分享等不同难度共创任务,在学习中贡献,在付出中收获
-
共享追踪主题前沿进展:在群内和公众号分享最新进展,领域论文速递
参与共创任务,共建学术社区:
-
读书会笔记:在交互式播放器上记录术语和参考文献
-
集智百科词条:围绕读书会主题中重要且前沿的知识概念梳理成词条。例如:
-
论文解读分享:认领待读列表中的论文,以主题报告的形式在社区分享
-
论文摘要翻译:翻译社区推荐论文中的摘要和图注
-
公众号文章:以翻译整理或者原创生产形式生产公众号文章,以介绍前沿进展。例如: -
论文翻译 -
科普文章翻译 -
讲座整理
PS:具体参与方式可以加入读书会后查看对应的共创任务列表,领取任务,与运营负责人沟通详情,上述规则的最终解释权归集智俱乐部所有。
读书会阅读材料
读书会阅读材料
主题1:因果表征学习导论
-
Bernhard Schölkopf, Francesco Locatello, Stefan Bauer, Nan Rosemary Ke, Nal Kalchbrenner, Anirudh Goyal, Yoshua Bengio: Towards Causal Representation Learning. CoRR abs/2102.11107 (2021)
主题2:因果表征学习理论基础
独立成分分析
-
Ilyes Khemakhem, Diederik P. Kingma, Ricardo Pio Monti, Aapo Hyvärinen: Variational Autoencoders and Nonlinear ICA: A Unifying Framework. AISTATS 2020: 2207-2217
-
Ilyes Khemakhem, Ricardo Pio Monti, Diederik P. Kingma, Aapo Hyvärinen:ICE-BeeM: Identifiable Conditional Energy-Based Deep Models Based on Nonlinear ICA. NeurIPS 2020
-
Luigi Gresele, Paul K. Rubenstein, Arash Mehrjou, Francesco Locatello, Bernhard Schölkopf:The Incomplete Rosetta Stone problem: Identifiability results for Multi-view Nonlinear ICA. UAI 2019: 217-227
独立因果机制
-
Siyuan Guo, Viktor Tóth, Bernhard Schölkopf, Ferenc Huszár:Causal de Finetti: On the Identification of Invariant Causal Structure in Exchangeable Data. CoRR abs/2203.15756 (2022)
-
J Peters, N Meinshausen, Causal inference using invariant prediction: identification and confidence intervals. J. Royal Stat. Soc. Series B, 947–1012 (2016).
-
B Schölkopf, et al., On causal and anticausal learning in ICML. (2012).
稀疏因果机制偏移
-
Yoshua Bengio, Tristan Deleu, Nasim Rahaman, Nan Rosemary Ke, Sébastien Lachapelle, Olexa Bilaniuk, Anirudh Goyal, Christopher J. Pal:A Meta-Transfer Objective for Learning to Disentangle Causal Mechanisms. ICLR 2020
-
Ronan Perry, Julius von Kügelgen, Bernhard Schölkopf:Causal Discovery in Heterogeneous Environments Under the Sparse Mechanism Shift Hypothesis. CoRR abs/2206.02013 (2022)
主题3:因果表征学习技术框架
因果变量学习
-
Francesco Locatello, Stefan Bauer, Mario Lucic, Gunnar Rätsch, Sylvain Gelly, Bernhard Schölkopf, Olivier Bachem:Challenging Common Assumptions in the Unsupervised Learning of Disentangled Representations. ICML 2019: 4114-4124
-
Raphael Suter, Ðorðe Miladinovic, Bernhard Schölkopf, Stefan Bauer:Robustly Disentangled Causal Mechanisms: Validating Deep Representations for Interventional Robustness. ICML 2019: 6056-6065
因果机制学习
-
Giambattista Parascandolo, Niki Kilbertus, Mateo Rojas-Carulla, Bernhard Schölkopf:Learning Independent Causal Mechanisms. ICML 2018: 4033-4041
-
Martín Arjovsky, Léon Bottou, Ishaan Gulrajani, David Lopez-Paz:Invariant Risk Minimization. CoRR abs/1907.02893 (2019)
因果结构学习
-
Yunzhu Li, Antonio Torralba, Anima Anandkumar, Dieter Fox, Animesh Garg:Causal Discovery in Physical Systems from Videos. NeurIPS 2020
-
Weiran Yao, Yuewen Sun, Alex Ho, Changyin Sun, Kun Zhang:Learning Temporally Causal Latent Processes from General Temporal Data. ICLR 2022
主题4:因果表征学习在机器学习中的应用
因果推断
-
Johansson, Fredrik, Uri Shalit, and David Sontag. “Learning representations for counterfactual inference.” In International conference on machine learning, pp. 3020-3029. PMLR, 2016.
-
Shalit, Uri, Fredrik D. Johansson, and David Sontag. “Estimating individual treatment effect: generalization bounds and algorithms.” In International Conference on Machine Learning, pp. 3076-3085. PMLR, 2017
-
Yao, Liuyi, Sheng Li, Yaliang Li, Mengdi Huai, Jing Gao, and Aidong Zhang. “Representation learning for treatment effect estimation from observational data.” Advances in Neural Information Processing Systems 31 (2018).
-
Hassanpour, Negar, and Russell Greiner. “CounterFactual Regression with Importance Sampling Weights.” In IJCAI, pp. 5880-5887. 2019.
-
Hassanpour, Negar, and Russell Greiner. “Learning disentangled representations for counterfactual regression.” In International Conference on Learning Representations. 2019.
-
Schwab, Patrick, Lorenz Linhardt, and Walter Karlen. “Perfect match: A simple method for learning representations for counterfactual inference with neural networks.” arXiv preprint arXiv:1810.00656 (2018).
因果生成模型
-
Louizos, Christos, Uri Shalit, Joris M. Mooij, David Sontag, Richard Zemel, and Max Welling. “Causal effect inference with deep latent-variable models.” Advances in neural information processing systems 30 (2017).
-
Yoon, Jinsung, James Jordon, and Mihaela Van Der Schaar. “GANITE: Estimation of individualized treatment effects using generative adversarial nets.” In International Conference on Learning Representations. 2018.
-
Bica, Ioana, James Jordon, and Mihaela van der Schaar. “Estimating the effects of continuous-valued interventions using generative adversarial networks.” Advances in Neural Information Processing Systems 33 (2020): 16434-16445.
-
Zhang, Weijia, Lin Liu, and Jiuyong Li. “Treatment effect estimation with disentangled latent factors.” In Proceedings of the AAAI Conference on Artificial Intelligence, vol. 35, no. 12, pp. 10923-10930. 2021.
因果公平性
-
Kusner, Matt J., Joshua Loftus, Chris Russell, and Ricardo Silva. “Counterfactual fairness.” Advances in neural information processing systems 30 (2017).
-
Nabi, Razieh, and Ilya Shpitser. “Fair inference on outcomes.” In Proceedings of the AAAI Conference on Artificial Intelligence, vol. 32, no. 1. 2018.
-
Chiappa, Silvia. “Path-specific counterfactual fairness.” In Proceedings of the AAAI Conference on Artificial Intelligence, vol. 33, no. 01, pp. 7801-7808. 2019.
-
Wu, Yongkai, Lu Zhang, Xintao Wu, and Hanghang Tong. “Pc-fairness: A unified framework for measuring causality-based fairness.” Advances in Neural Information Processing Systems 32 (2019).
-
Kilbertus, Niki, Mateo Rojas Carulla, Giambattista Parascandolo, Moritz Hardt, Dominik Janzing, and Bernhard Schölkopf. “Avoiding discrimination through causal reasoning.” Advances in neural information processing systems 30 (2017).
因果强化学习
-
Bareinboim, Elias, Andrew Forney, and Judea Pearl. “Bandits with unobserved confounders: A causal approach.” Advances in Neural Information Processing Systems 28 (2015).
-
Biwei Huang, Fan Feng, Chaochao Lu, Sara Magliacane, Kun Zhang. “AdaRL: What, Where, and How to Adapt in Transfer Reinforcement Learning.” International Conference on Learning Representation (2022).
-
De Haan, Pim, Dinesh Jayaraman, and Sergey Levine. “Causal confusion in imitation learning.” Advances in Neural Information Processing Systems 32 (2019).
-
Bottou, Léon, Jonas Peters, Joaquin Quiñonero-Candela, Denis X. Charles, D. Max Chickering, Elon Portugaly, Dipankar Ray, Patrice Simard, and Ed Snelson. “Counterfactual Reasoning and Learning Systems: The Example of Computational Advertising.” Journal of Machine Learning Research 14, no. 11 (2013).
-
Buesing, Lars, Theophane Weber, Yori Zwols, Sebastien Racaniere, Arthur Guez, Jean-Baptiste Lespiau, and Nicolas Heess. “Woulda, coulda, shoulda: Counterfactually-guided policy search.” arXiv preprint arXiv:1811.06272 (2018).
-
Pitis, Silviu, Elliot Creager, and Animesh Garg. “Counterfactual data augmentation using locally factored dynamics.” Advances in Neural Information Processing Systems 33 (2020): 3976-3990.
-
Dietterich, Thomas, George Trimponias, and Zhitang Chen. “Discovering and removing exogenous state variables and rewards for reinforcement learning.” In International Conference on Machine Learning, pp. 1262-1270. PMLR, 2018.
-
Zhang, Amy, Clare Lyle, Shagun Sodhani, Angelos Filos, Marta Kwiatkowska, Joelle Pineau, Yarin Gal, and Doina Precup. “Invariant causal prediction for block mdps.” In International Conference on Machine Learning, pp. 11214-11224. PMLR, 2020.
主题5:因果表征学习在工业场景中的应用
因果推荐系统
-
Wu, Peng, Haoxuan Li, Yuhao Deng, Wenjie Hu, Quanyu Dai, Zhenhua Dong, Jie Sun, Rui Zhang, and Xiao-Hua Zhou. “On the opportunity of causal learning in recommendation systems: Foundation, estimation, prediction and challenges.” In Proceedings of the International Joint Conference on Artificial Intelligence, Vienna, Austria, pp. 23-29. 2022.
-
Gao, Chen, Yu Zheng, Wenjie Wang, Fuli Feng, Xiangnan He, and Yong Li. “Causal Inference in Recommender Systems: A Survey and Future Directions.” arXiv preprint arXiv:2208.12397 (2022).
因果自然语言处理
-
Keith, Katherine A., David Jensen, and Brendan O’Connor. “Text and causal inference: A review of using text to remove confounding from causal estimates.” arXiv preprint arXiv:2005.00649 (2020).
推荐语:这是一篇因果自然语言处理的研究综述,很好地阐释了因果自然语言处理的基本问题、任务分类、技术框架、和未来可能的研究方向。
因果科学社区简介
因果科学社区简介
关于举办方和集智俱乐部读书会
关于举办方和集智俱乐部读书会
主办方:集智俱乐部
协办方:集智学园
集智俱乐部成立于 2003 年,是一个从事学术研究、享受科学乐趣的探索者的团体,也是国内最早的研究人工智能、复杂系统的科学社区。它倡导以平等开放的态度、科学实证的精神,进行跨学科的研究与交流,力图搭建一个中国的“没有围墙的研究所”。
集智学园成立于2016年,是集智俱乐部孕育的创业团队。集智学园致力于传播复杂性科学、人工智能等前沿知识和新兴技术,促进、推动复杂科学领域的知识探索与生态构建。
集智俱乐部读书会是面向广大科研工作者的系列论文研读活动,其目的是共同深入学习探讨某个科学议题,了解前沿进展,激发科研灵感,促进科研合作,降低科研门槛。
读书会活动始于 2008 年,至今已经有 50 余个主题,内容涵盖复杂系统、人工智能、脑与意识、生命科学、因果科学、高阶网络等。凝聚了众多优秀科研工作者,促进了科研合作发表论文,孵化了许多科研产品。如:2013 年的“深度学习”读书会孕育了彩云天气 APP,2015 年的“集体注意力流”读书会产生了众包书籍《走近2050》,2020年的开始因果科学读书会孕育了全国最大的因果科学社区等。
加入集智VIP,即可解锁集智全站课程、读书会。详见:
集智学园2022年费VIP开启,与5000+集智社区成员一起探索复杂性!





