什么是处理(干预)效应 | 集智百科
本词条由集智俱乐部众包生产,难免存在纰漏和问题,欢迎大家留言反馈或者前往对应的百科词条页面进行修改,一经修改,可以获得对应的积分奖励噢!
目录
平均处理效应 (Average Treatment Effect, ATE)是在随机试验个体、政策干预评估和医药试验中用于比较治疗或干预的一种测量方法。平均处理效应测量分配给处理个体和控制个体之间的平均结果的差异。在随机试验中,平均处理效应可以通过比较样本在处理个体和未处理个体的平均结果进行估计获得。然而,平均处理效应通常被理解为研究人员希望知道的一个因果参数 (即一个总体的估计或属性) ,定义时不参考试验设计或估计过程。观察性研究和随机赋值的实验性研究设计都可以用多种方式进行估计平均处理效应。
一般性定义General definition
处理 (Treatment)一词起源于农业和医药领域的早期统计分析,现在被更广泛地用于自然科学和社会科学的其他领域,尤其是心理学、政治科学和经济学,例如评价公共政策的影响。试验中的处理或结果 (Outcome)的具体内容在评估平均处理效应时相对而言并不重要,也就是说,平均处理效应估算要求对某些个体进行处理,但不处理其他个体,但处理具体内容(例如药物、奖励性支付、政治广告)与平均处理效应的定义和估计无关。
“处理效应”一词是指某一特定处理或干预 (如给予某种药物)对结果变量(如病人的康复)的因果影响 (Causal Effect)。在因果关系的 Neyman-Rubin“潜在结果框架”中,处理效应被定义为每个独立个体的两个“潜在结果”,如果该个体给与处理,就会显现一种结果;如果该个体不给予处理,就会显现出另一种结果。“处理效果”是这两种潜在结果之间的差异。然而,这种个体水平的处理效果是不可观察到的,因为每个独立个体只能接受处理或不接受处理,但不能同时接受和不接受。随机分配需要确保给处理组的个体和对照组的个体在大量迭代实验上是服从同分布。事实上,两组中的个体在协变量和潜在结果上的分布是相同的。因此,处理个体之间的平均结果是控制个体的平均结果的反事实。这两个平均值之间的差异是平均处理效应 ,这是不可观测到的个体层面的处理效果的中心趋势的估计。如果样本是从总体中随机构成,那么样本平均处理效应 (Sample Average Treatment Effect, SATE)也是总体平均处理效应 (Population Average Treatment Effect,PATE)的估计值。
虽然实验确保了潜在结果以及所有协变量在处理组和对照组中的等价分布,但是在观察性研究中,情况并非如此。在观察性研究中,处理组和对照组个体并不服从随机分布,因此处理个体可能取决于未观测到或不可观测的因素。观察到的因素可以在统计学上加以控制 (如通过回归或匹配) ,但是任何关于平均处理效应的估计都可能与不可观察因素混淆,这些因素影响了哪些个体接受了处理,哪些个体没有接受处理。
形式化定义Formal definition
为了形式化定义平均处理效应,我们定义了两个潜在的结果: y0(i)是个体i没有被处理时的结果变量的取值,y1(i)是个体i被处理时的结果变量的取值。例如,y0(i)是个体i没有被注射研究药物时的健康状态,y1(i)是个体i被注射药物时的健康状态。
个体i的处理效应定义为y1(i)–y0(i)=β(i) 。在一般情况下,这种处理效果在个体之间是不一样的。平均处理效果ATE的定义为
这里对总体中所有N数量个体的处理效应进行了聚合平均计算。
如果我们能观察到一个大型代表性样本中每个个体的y1(i)和y0(i),我们可以简单地通过取样本中y1(i)–y0(i)的平均值来估计平均处理效应。然而,我们不能同时观察每个个体的y1(i)、y0(i),因为每个个体不能同时被处理和不被处理。例如,在药物例子中,我们只能观察到个体接受过药物治疗的y1(i)和个体未接受药物的y0(i)。这是研究者们在评估治疗效果时面临的主要问题,并因此引发了大量与估计方法相关的研究。
估计Estimation
根据数据及其潜在环境的不同,我们可以使用许多方法来估计平均处理效应ATE。最常见方法包括:
-
自然实验 Natural Experiment
-
双重差分模型 Difference in Differences
-
断点回归设计 Regression Discontinuity Design
-
倾向评分匹配 Propensity Score Matching
-
工具变量估计 Instrumental Variables Estimation
示例An example
在这个例子中,平均处理效应为正值意味着就业政策延长了失业期,平均处理效应为负值表明就业政策缩短了失业期。平均处理效应等于零表明提供就业政策对失业期长短并没有任何利处或不利。判断一个平均处理效应估计值是否为可以区分的零值需要进行统计推断。
因为平均处理效应是对处理的平均效果估计,正值或者负值平均处理效应并不表明处理对任意特定个体是有益或者有害。因此,平均处理效应忽略了处理效应的分布。即使平均处理效应是正值,总体的部分个体也可能因为这种处理或者干预而使得情况变得更糟。
异质处理效应 Heterogenous treatment effects
一种异质处理效应的研究方法是将研究数据进行分组 (如按照男、女性别,或者区域进行划分) ,比较平均处理效果在子组内的效应差异。每个子组的平均处理效应被称为“条件平均处理效应”(Conditional Average Treatment Effect,CATE) ,也就是说,每个子组的平均处理效应被称为条件平均处理效应,以子组内的分类方式为条件。
编者推荐
书籍推荐
-
统计因果推理入门 对应英文Causal Inference in Statistics: A Primer
-
Counterfactuals and Causal Inference: Methods and Principles for Social Research
课程推荐
文章总结
-
知乎上RandomWalk总结的关于因果推断之Potential Outcome Framework的内容,其中提到因果退镀and额目标就是从观测数据中估计treatment effect。
-
Mesonychid在自己的个人主页上分享的关于Donald-Rubin潜在结果模型的解释。
-
Yishi Lin在自己的个人主页上分享的关于因果推断的一些介绍因果推断漫谈(一):掀开 “因果推断” 的面纱
https://dango.rocks/blog/2019/01/08/Causal-Inference-Introduction1/
相关路径
-
因果科学与Casual AI读书会必读参考文献列表,这个是根据读书会中解读的论文,做的一个分类和筛选,方便大家梳理整个框架和内容。
https://pattern.swarma.org/path?id=99
-
因果推断方法概述,这个路径对因果在哲学方面的探讨,以及因果在机器学习方面应用的分析。
https://pattern.swarma.org/path?id=9
-
因果科学和 Causal AI入门路径,这条路径解释了因果科学是什么以及它的发展脉络。此路径将分为三个部分进行展开,第一部分是因果科学的基本定义及其哲学基础,第二部分是统计领域中的因果推断,第三个部分是机器学习中的因果(Causal AI)。
https://pattern.swarma.org/path?id=90
百科项目志愿者招募
作为集智百科项目团队的成员,本文内容由Janeway用户参与编译,LFZ参与审校,思无涯咿呀咿呀编辑。我们也为每位作者和志愿者准备了专属简介和个人集智百科主页,更多信息可以访问其集智百科个人主页。
在这里从复杂性知识出发与伙伴同行,同时我们希望有更多志愿者加入这个团队,使百科词条内容得到扩充,并为每位志愿者提供相应奖励与资源,建立个人主页与贡献记录,使其能够继续探索复杂世界。
如果你有意参与更加系统精细的分工,扫描二维码填写报名表,我们期待你的加入!
来源:集智百科
编辑:王建萍
点击“阅读原文”,阅读处理(干预)效应词条原文与参考文献