导语


缺失数据经常出现在医疗健康与社会科学研究中,是统计分析中非常重要的研究内容。双稳健方法通过结合逆概率加权和插补的方法应用于缺失数据模型。本次读书会将邀请北京大学吴鹏老师为大家介绍双稳健方法的一般框架:双稳健估计方程,双稳健损失函数。前者可用于得到一般模型参数的双稳健估计,后者常用于预测问题中。


由智源社区、集智俱乐部联合举办的因果科学与Causal AI读书会第三季其目标是:将主要结合因果推断的潜在结果(Potential Outcomes)框架展开讨论,并尝试在不同领域,包括但不限于医学、经济学、机器学习等领域,尝试建立与SCM的对应关系。读书自2021年10月24日开始,每周日上午09:00-11:00举办,持续时间预计 2-3 个月






背景




在许多研究中,缺失数据是普遍存在的问题,尤其是当研究对象涉及到人时,如流行病学、心理学和社会学等。大多数处理缺失数据的方法可大致分为逆概率加权或插补。双稳健方法结合了这两种方法,它通常比逆概率加权更有效,比插补对于模型错误指定更稳健。双稳健方法的适用领域非常广泛,如因果问题可视为缺失数据问题。





内容简介




本次报告对双稳健方法的基本原理和思路做一个概要介绍,内容包括经典双稳健方法及其局限性。为克服双稳健性的局限性,进一步介绍双稳健回归估计,双稳健逆概率加权估计,偏差下降的双稳健估计。最后,我们总结双稳健方法的一般框架:双稳健估计方程,双稳健损失函数。前者可用于得到一般模型参数的双稳健估计,后者常用于预测问题中。





主讲人




吴鹏,北京大学北京国际数学研究中心博士后,导师为周晓华教授,主要研究方向为因果推断和推荐系统。

参考文献

  1. Seaman, S. R. & Vansteelandt, S. (2018), “Introduction to double robust methods for incomplete data’, Statistical Science 33, 184-197.
  2. Scharfstein, D. O., Rotnitzky, A. & Robins, J. M. (1999), “Adjusting for nonignorable drop-out using semiparametric nonresponse models”, Journal of American Statistical Association 94, 1096-1120.
  3. Bang, H. & Robins, J. (2005), “Doubly robust estimation in missing data and causal inference models”, Biometrics 61, 962-973.
  4. Kang, J. D. & Schafer, J. L. (2007), “Demystifying double robustness: a comparison of lternative strategies for estimating a population mean from incomplete data”, Statistical Science 22, 523-539.
  5. Mark J. van der Laan & Sherri Rose (2011). “Targeted Learning: Causal Inference for Observational and Experimental Data”. Springer.
  6. Robins, J., Sued, M., Lei-Gomez, Q. & Rotnitzky, A. (2007), “Comment: Performance of double-robust estimators when inverse probability weights are highly variable”, Statistical Science 22, 544-559.
  7. Tan, Z. (2006a), “A distributional approach for causal inference using propensity scores”, Journal of the American Statistical Association 101(476), 1619-1637.
  8. Tan, Z. (2006b), “Regresion and weighting methods for causal inference using instrumental variables”, Journal of the American Medical Association 101, 1607-1618.
  9. Tan, Z. (2010), “Bounded, effcient, and doubly robust estimation with inverse weighting”, Biometric 92(2), 1-22.
  10. Tan, Z. (2011), “Effcient restricted estimators for conditional mean models with missing data”, Biometrika 98, 663-684.
  11. Vermeulen, K. & Vansteelandt, S. (2015), “Bias-reduced doubly robust estimation”, Journal of the American Medical Association 110, 1024-1036.
  12. Vermeulen, K. & Vansteelandt, S. (2016),”Data-adaptive bias-reduced doubly robust estimation”, Int. J. Biostat. 12, 253-282.
  13. Zhiqiang Tan (2020), “Model-assisted inference for treatment effects using regularized calibrated estimation with high-dimensional data”, The Annals of Statistics 48(2), 811-837.
  14. Peng Wu, Zhiqiang Tan, Wenjie Hu & Xiao-Hua Zhou (2021), ‘Model-assisted inference for covariate-Specic treatment effects with high-dimensional data’, arXiv:2105.11362.





直播信息




时间:

2022年3月20日上午9:00-11:00


参与方式:

  • 文末扫码参加读书会第三季,加入群聊,获取系列读书会回看权限,成为因果社区种子用户,与900余位社区的科研工作者沟通交流,共同推动因果科学的发展。
  • 集智俱乐部 B 站免费直播,扫码可预约。

扫码预约



因果科学读书会第三季启动


由智源社区、集智俱乐部联合举办的因果科学与Causal AI读书会第三季,将主要面向两类人群:如果你从事计算机相关方向研究,希望为不同领域引入新的计算方法,通过大数据、新算法得到新成果,可以通过读书会各个领域的核心因果问题介绍和论文推荐快速入手;如果你从事其他理工科或人文社科领域研究,也可以通过所属领域的因果研究综述介绍和研讨已有工作的示例代码,在自己的研究中快速开始尝试部署结合因果的算法。读书自2021年10月24日开始,每周日上午 9:00-11:00举办,持续时间预计 2-3 个月。

读书会大纲一览:

Donald Rubin:Essential Concepts of causal inference

「基础理论学习」
因果推断的潜在结果框架在实验性研究的应用
因果推断在观察性研究中的应用:DESIGN

因果推断在观察性研究中的应用(续):ANALYSIS

「案例研讨」
医学、药学、生物学中的研究案例
管理学、经济学、社会学及政治学中的研究案例
因果随机森林及其在工业界的应用
多级治疗与连续性暴露
因果推荐系统
因果在自然语言处理中的应用

因果与公平性和可解释性

「深入理论学习」

双稳健估计、处理极端倾向得分的方法
阴性对照试验
高维因果推断
结合随机化试验数据与观察性数据



点击“阅读原文”,报名直播