今早9点,“因果科学与Causal AI”读书会将进行第八期的线上论文分享,主题是“因果机器学习”,将由亚利桑那州立大学博士郭若城来进行分享,本次内容将在集智俱乐部B站直播。

主讲人介绍:

郭若城,亚利桑那州立大学博士,研究方向为因果推理、机器学习、数据挖掘。


让我们考虑两种动物,会学人说话的鹦鹉和乌鸦喝水中的乌鸦。我们知道鹦鹉只会模仿人类的语音,却不知道语言的意义。而乌鸦可以认识到放入石子就可以使水面上升这一层因果关系。我们可以把鹦鹉看作是能做curve fitting的机器学习模型而把乌鸦看作是体现变量之间因果关系的因果模型。比起问它们谁更聪明,我想更有意义的做法是结合他俩的技能,帮助我们解决实际问题。
 
在机器学习在很多任务中已取得成功的今天,我们想回答的问题是:因果推断能否帮助机器学习在一些任务中做得更好,以及因果推断能否受益于新的机器学习算法?在这次的读书会中,我会从这两个方面来介绍一些现存的结合因果推断和机器学习的研究方向。在传统的利用观测性数据的因果推断中,很多模型往往通过很强的、可能不能被满足的假设来避免考虑hidden confounders。而最近的一些工作中,我们发现利用深度学习模型我们可以利用观测性数据中附带的网络信息弱化这一假设,提升因果推断模型的表现。
 
机器学习模型的一些问题也可以利用其背后的因果模型来解决或者缓解。这里的第一个问题是,如何使神经网络更加鲁棒?从因果性的角度,鲁棒意味着我们要避免学习到spurious correlation?比如在动物图像分类中,骆驼常常出现在沙漠中,如何能避免分类器利用沙漠背景来预测骆驼这个类?最近,在Invariant Risk Minimization (IRM) 这个工作中,作者们把具体问题中因果关系的限制条件转化成了机器学习模型中的inductive bias,从而达到这一目的。而在我们的工作中,我们发现IRM是一个过于宽泛的条件。针对这一问题我们提出了一个简单有效的解决方案。第二个问题是,在使用用户反馈作为标签的机器学习任务中,如何做到利用历史数据在线下对新模型进行评测和优化,使其线上效果得到提升。在最近的推荐系统和搜索的工作中,人们发现把用户反馈标签的因果图融入模型设计将使我们在这一任务中做得更好。

 

大纲:
  • Machine learning for causal inference

  • Learning causality with networked observational data

  • Causality-aware machine learning

  • Out-of-distribution prediction with causal inductive bias

  • Unbiased interactive machine learning


参考文献:

[1] Arjovsky, Martin, Léon Bottou, Ishaan Gulrajani, and David Lopez-Paz. “Invariant risk minimization.” arXiv preprint arXiv:1907.02893 (2019).

[2] Guo, Ruocheng, Lu Cheng, Jundong Li, P. Richard Hahn, and Huan Liu. “A survey of learning causality with data: Problems and methods.” ACM Computing Surveys (CSUR) 53, no. 4 (2020): 1-37.

[3] Guo, Ruocheng, Jundong Li, and Huan Liu. “Learning individual causal effects from networked observational data.” In Proceedings of the 13th International Conference on Web Search and Data Mining, pp. 232-240. 2020.

[4] Guo, Ruocheng, Jundong Li, and Huan Liu. “Counterfactual Evaluation of Treatment Assignment Functions with Networked Observational Data.” In Proceedings of the 2020 SIAM International Conference on Data Mining, pp. 271-279. Society for Industrial and Applied Mathematics, 2020.

[5] Guo, Ruocheng, Xiaoting Zhao, Adam Henderson, Liangjie Hong, and Huan Liu. “Debiasing Grid-based Product Search in E-commerce.” In Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining, pp. 2852-2860. 2020.

[6] Joachims, Thorsten, Adith Swaminathan, and Tobias Schnabel. “Unbiased learning-to-rank with biased feedback.” In Proceedings of the Tenth ACM International Conference on Web Search and Data Mining, pp. 781-789. 2017.



直播信息与报名方式


直播时间:今早(11月15日) 09:00-12:00


直播地址:集智俱乐部 B 站直播间

👀关注B站主播“集智俱乐部”
不错过每一场集智重磅直播

直播地址:

https://live.bilibili.com/8091531



系列读书会报名


大数据时代的下一场变革——因果革命正在酝酿之中,通过融合因果推理和机器学习而构建出来的Causal AI系统,有望奠定强人工智能的基石。


集智俱乐部联合北京智源人工智能研究院,邀请了一批对因果科学与Casual AI感兴趣的研究者,开展为期2-3个月的系列线上读书会,研读经典和前沿论文,并尝试集体撰写一部书籍。如果你也从事相关的研究、应用工作,欢迎报名,参与读书会的讨论!

 

时间:9月20日起,每周日晚19:00-21:00,持续约2-3个月
模式:线上闭门读书会;收费-退款的保证金模式;读书会成员认领解读论文
费用:299/人

 

了解读书会具体规则、报名读书会请点击下方文章:

因果科学与 Causal AI 系列读书会 | 众包出书


目前读书会已经有超过130余人的海内外高校科研院所的一线科研工作者以及互联网一线从业人员参与,如果你也对这个主题感兴趣,就快加入我们吧!


针对读书会的主题,由发起人龚鹤扬设置好了内容框架,每个主题下有一个负责人来负责维护组织相关内容,目前已经定好的如图所示,欢迎对主题感兴趣的联系相关负责人,以及来认领相关主题~



推荐阅读


图灵奖得主Judea Pearl 智源大会演讲:从“大数据革命”到“因果革命”
了研究因果关系,原来科学家在这么多方向上都有尝试
因果发现:如何让算法成为复杂系统中的“福尔摩斯”?
因果科学:连接统计学、机器学习与自动推理的新兴交叉领域
因果观念新革命?万字长文,解读复杂系统背后的暗因果
加入集智,一起复杂!






集智俱乐部QQ群|877391004

商务合作及投稿转载|swarma@swarma.org

◆ ◆ 

搜索公众号:集智俱乐部


加入“没有围墙的研究所”

让苹果砸得更猛烈些吧!



👇点击“阅读原文”,进入直播间