导语


推荐系统 (RS) 和因果推断有着天然的联系。RS 感兴趣的许多实际问题本质上是反事实(或因果)问题,例如暴露后点击率(post-view click-through rate prediction), 点击后转化率(post-click conversion rate prediction)和uplift模型等。本次读书会邀请北京大学周晓华教授团队的吴鹏博士介绍他们与华为诺亚实验室的最新成果:在潜在结果框架下,给出一个因果分析框架以适应推荐系统中的不同应用场景,并给出RS中的各种bias进行形式化/数学定义,从而提供一个严格的因果推荐操作指南。

由智源社区、集智俱乐部联合举办的因果科学与Causal AI读书会第三季,其目标是:将主要结合因果推断的潜在结果(Potential Outcomes)框架展开讨论,并尝试在不同领域,包括但不限于医学、经济学、机器学习等领域,尝试建立与SCM的对应关系。读书自2021年10月24日开始,每周日上午 09:00-11:00举办,持续时间预计 2-3 个月。





背景




近年来,将因果的方法引入到推荐系统获得了极大的关注并逐渐成为一种趋势。一方面,现有因果推荐的方法缺乏对科学问题的严格形式化(数学)定义,许多困惑需要进一步澄清:究竟在估计什么?为了什么目的?在哪种情景下?采用哪种技术?在哪种假定条件下?另一方面,从技术上说,各种各样的偏差是阻碍我们从观察数据中得出因果结论的主要原因。然而,推荐系统中各种bias 也没有严格形式化定义。这两个问题极大地阻碍了因果推荐系统的发展。





内容简介




本次分享从因果推断的角度,较为系统地梳理了推荐系统中的一些实际问题。我们试图提供一个严格的因果推荐操作指南。

1. 定义因果参数(或估计量)以回答科学问题。因果研究先要确定科学问题后,定义unit,target population, treatment, feature, outcome, potential outcomes, causal parameters。我们将澄清这些概念背后存在的假定,并讨论当假定不成立时所带来的后果。
2. 收集数据后,讨论因果参数的可识别性。数据只能反映关联关系,要从关联关系上升到因果关系,都需要一定的可识别性假定。我们将阐述可识别性背后存在的假定,讨论当假定不成立时所带来的后果,并由此给出推荐系统中各种bias的数学定义。最后,以推荐系统的实际问题作为例子进行说明,并讨论一些纠偏方法。
3. 建立模型,得到因果参数的无偏估计。

本次分享基于北京大学周晓华教授团队与华为诺亚实验室的最新成果:

“Causal Analysis Framework for Recommendation”, https://arxiv.org/abs/2201.06716





主讲人




吴鹏,北京大学北京国际数学研究中心博士后,导师为周晓华教授,主要研究方向为因果推断和推荐系统。

周晓华课题组博士后招聘


北京大学北京国际数学研究中心和公共卫生学院生物统计系周晓华课题组招聘博士后,研究方向为研究面向药品临床需求的创新统计方法和解决方案、构建药品临床研究结果的因果效应评估体系、开发全生命周期管理中的实时精准预警模型。


年龄不超过35岁且获取博士学位不超过3年的青年学者对周晓华课题组博士后招聘感兴趣可以查看:招聘| 北京大学周晓华课题组博士后招聘启事了解更多详情。





直播信息




时间:

2022年1月23日上午9: 00-11: 00


参与方式:

  • 文末扫码参加读书会第三季,加入群聊,获取系列读书会回看权限,成为因果社区种子用户,与900余位社区的科研工作者沟通交流,共同推动因果科学的发展。
  • 集智俱乐部 B 站免费直播,扫码可预约。

扫码预约



因果科学读书会第三季启动


由智源社区、集智俱乐部联合举办的因果科学与Causal AI读书会第三季,将主要面向两类人群:如果你从事计算机相关方向研究,希望为不同领域引入新的计算方法,通过大数据、新算法得到新成果,可以通过读书会各个领域的核心因果问题介绍和论文推荐快速入手;如果你从事其他理工科或人文社科领域研究,也可以通过所属领域的因果研究综述介绍和研讨已有工作的示例代码,在自己的研究中快速开始尝试部署结合因果的算法。读书自2021年10月24日开始,每周日上午 9:00-11:00举办,持续时间预计 2-3 个月。

读书会大纲一览:

Donald Rubin:Essential Concepts of causal inference

「基础理论学习」
因果推断的潜在结果框架在实验性研究的应用
因果推断在观察性研究中的应用:DESIGN

因果推断在观察性研究中的应用(续):ANALYSIS

「案例研讨」
医学、药学、生物学中的研究案例
管理学、经济学、社会学及政治学中的研究案例
因果随机森林及其在工业界的应用
多级治疗与连续性暴露
因果推荐系统
因果在自然语言处理中的应用

因果与公平性和可解释性

「深入理论学习」

双稳健估计、处理极端倾向得分的方法
阴性对照试验
高维因果推断
结合随机化试验数据与观察性数据



点击“阅读原文”,报名直播