导语


在对观察性数据的分析中,我们通常要求非混淆性假设成立,即给定协变量或倾向得分后,潜在结果与分配方案独立。这时,观察性数据与随机化试验具有相似之处。然而,在复杂的观察性研究中,非混淆性假设可能不成立,这时就需要仔细评估非混淆性假设、执行敏感性分析,或者引入工具变量来评估因果作用。

本次读书会的讨论将在周日上午9点继续围绕Guido Imben和Donald Rubin的著作Causal Inference for Statistics, Social, and Biomedical Sciences第五部分进行讨论。本次读书会也将参考Miguel Hernan和James Robins的Causal Inference: What If,以及Paul Rosenbaum的Design of Observational Studies,主要介绍G估计、敏感性分析、工具变量等方法。


由于上周Per Johansson教授的分享十分精彩,邀请嘉宾也与Per展开了热烈的讨论。本周日晚上7点,我们邀请Per Johansson教授继续分享计量经济学中经济学中自然实验和准实验的话题,展开介绍DID和synthetic control两种设计方法。周日晚上直播参与方式也可在文中获取。






背景




2004年,国际知名医学杂志《柳叶刀》上发表了两篇文章,一篇题为“观察性研究何时才能像随机试验那样可信?”,另一篇题为“那些令人困惑的维生素:我们能从观察性试验和随机试验证据之间的差异中学到什么?”在随机试验中, 采用投硬币的方式决定下一个人分配到处理组还是对照组,而在观察性研究中,处理分配不受随机实验控制。尽管第一个标题乐观,第二个标题悲观,但两篇文章都取得了平衡,或许略有偏向悲观。


前者在文中转载了下面的讽刺漫画:一名电视新闻记者坐在写着“今日随机医学新闻”的横幅和三个旋转器的下方,旋转器展现的结果是“咖啡可以导致双胞胎的抑郁。” 新闻记者面无表情地说:“根据今天发布的一份报告……”后者注意到《柳叶刀》上近期的两篇关于维生素C与冠心病的文章。一项大型观察性研究发现冠心病的死亡率和血液中维生素C含量具有统计显著的负相关。而另一项大型随机对照试验将安慰剂药片与含维生素C复合维生素药片进行了比较,发现安慰剂组的死亡率略有降低,但不显著。随机试验和观察性研究似乎相互矛盾。这是为什么呢?


图:今日随机医学新闻:咖啡导致双胞胎抑郁,Jim Borgman





内容简介




什么是好的观察性研究?好的观察性研究应当具备什么样的特征?这是本次读书会将要回答的问题。


本次读书会延续之前关于观察性研究的分析,在非混淆性假设成立的条件下考察因果作用的估计方法。首先探讨James Robins提出的G估计,该方法巧妙地利用了非混淆性假设,在一定形式下还能得到双稳健估计。


然而,非混淆性假设并不总是成立。我们将介绍三种评估非混淆性假设的策略:伪结局方法、伪处理方法、子集非混淆性方法。随后,我们讨论敏感性分析,考察当非混淆性假设不成立时因果作用的估计会如何变化——以及对非混淆性假设的何种程度偏离会导致原有结论失效。


未观测到的混杂变量是观察性研究的最大挑战。事实上,这也是差的观察性研究与好的观察性研究的重要区别。如果存在未观测到的混杂变量,非混淆性假设一般不成立。为了识别或估计因果作用,一种可行的方法是引入工具变量。我们将介绍与工具变量相关的几种分析策略,如意向治疗分析、符合方案分析、实际方案分析、Wald估计或两阶段最小二乘估计。


最后,我们以关于观察性研究的评述结束讨论。





主持人




邓宇昊,北京大学数学科学学院统计学2018级博士生,导师为周晓华教授,主要研究方向为生物统计、因果推断、临床试验研究中的统计学方法,已在Biometrics、Statistics in Medicine等杂志发表多篇论文。





直播信息




时间:

2021年12月5日上午9:00-11:00


参与方式:

  • 文末扫码参加读书会第三季,加入群聊,获取系列读书会回看权限,成为因果社区种子用户,与900余位社区的科研工作者沟通交流,共同推动因果科学的发展。
  • 集智俱乐部视频号直播,点击下方可预约。





Per Johansson:

经济学中自然实验和准实验




上周日,Per Johansson教授概览了计量经济学中自然实验和准实验的框架,并介绍了工具变量和断点回归两种设计方法。北京大学张俊妮老师、北京大学苗旺老师、清华大学胡悦老师、普林斯顿大学黄俊铭老师以及参与直播的学者与Per Johansson教授针对计量经济学展开了精彩的讨论。

上周内容精彩回顾:Per Johansson:经济学中自然实验和准实验  | 周日直播·因果科学读书会


本周日晚上9点,Per Johansson教授将继续为我们带来精彩的报告,欢迎各位老师同学的参与!

时间:
2021年12月5日19:00-21:00

参与方式:

  • 集智俱乐部 B 站免费直播
  • 扫码获取Zoom房间号可直接开麦与主讲人交流




因果科学读书会第三季启动


由智源社区、集智俱乐部联合举办的因果科学与Causal AI读书会第三季,将主要面向两类人群:如果你从事计算机相关方向研究,希望为不同领域引入新的计算方法,通过大数据、新算法得到新成果,可以通过读书会各个领域的核心因果问题介绍和论文推荐快速入手;如果你从事其他理工科或人文社科领域研究,也可以通过所属领域的因果研究综述介绍和研讨已有工作的示例代码,在自己的研究中快速开始尝试部署结合因果的算法。读书自2021年10月24日开始,每周日上午 9:00-11:00举办,持续时间预计 2-3 个月。

读书会大纲一览:

Donald Rubin:Essential Concepts of causal inference

「基础理论学习」
因果推断的潜在结果框架在实验性研究的应用
因果推断在观察性研究中的应用:DESIGN

因果推断在观察性研究中的应用(续):ANALYSIS

「案例研讨」
医学、药学、生物学中的研究案例
管理学、经济学、社会学及政治学中的研究案例
因果随机森林及其在工业界的应用
多级治疗与连续性暴露
因果推荐系统
因果在自然语言处理中的应用

因果与公平性和可解释性

「深入理论学习」

双稳健估计、处理极端倾向得分的方法
阴性对照试验
高维因果推断
结合随机化试验数据与观察性数据




点击“阅读原文”,报名读书会