什么是处理（干预）效应 | 集智百科

2021-07-03 8,888 0

“集智百科精选”是一个长期专栏，持续为大家推送复杂性科学相关的基本概念和资源信息。作为集智俱乐部的开源科学项目，集智百科希望打造复杂性科学领域最全面的百科全书，欢迎对复杂性科学感兴趣、热爱知识整理和分享的朋友加入！

本文是对集智百科中“处理（干预）效应”词条的摘录，参考资料及相关词条请参阅百科词条原文。

本词条由集智俱乐部众包生产，难免存在纰漏和问题，欢迎大家留言反馈或者前往对应的百科词条页面进行修改，一经修改，可以获得对应的积分奖励噢！

一、一般性定义

二、形式化定义

三、估计

四、示例

五、异质处理效应

六、编者推荐

七、百科项目志愿者招募

平均处理效应 (Average Treatment Effect, ATE)是在随机试验个体、政策干预评估和医药试验中用于比较治疗或干预的一种测量方法。平均处理效应测量分配给处理个体和控制个体之间的平均结果的差异。在随机试验中，平均处理效应可以通过比较样本在处理个体和未处理个体的平均结果进行估计获得。然而，平均处理效应通常被理解为研究人员希望知道的一个因果参数 (即一个总体的估计或属性) ，定义时不参考试验设计或估计过程。观察性研究和随机赋值的实验性研究设计都可以用多种方式进行估计平均处理效应。

一般性定义General definition

处理 (Treatment)一词起源于农业和医药领域的早期统计分析，现在被更广泛地用于自然科学和社会科学的其他领域，尤其是心理学、政治科学和经济学，例如评价公共政策的影响。试验中的处理或结果 (Outcome)的具体内容在评估平均处理效应时相对而言并不重要，也就是说，平均处理效应估算要求对某些个体进行处理，但不处理其他个体，但处理具体内容(例如药物、奖励性支付、政治广告)与平均处理效应的定义和估计无关。

“处理效应”一词是指某一特定处理或干预 (如给予某种药物)对结果变量(如病人的康复)的因果影响 (Causal Effect)。在因果关系的 Neyman-Rubin“潜在结果框架”中，处理效应被定义为每个独立个体的两个“潜在结果”，如果该个体给与处理，就会显现一种结果；如果该个体不给予处理，就会显现出另一种结果。“处理效果”是这两种潜在结果之间的差异。然而，这种个体水平的处理效果是不可观察到的，因为每个独立个体只能接受处理或不接受处理，但不能同时接受和不接受。随机分配需要确保给处理组的个体和对照组的个体在大量迭代实验上是服从同分布。事实上，两组中的个体在协变量和潜在结果上的分布是相同的。因此，处理个体之间的平均结果是控制个体的平均结果的反事实。这两个平均值之间的差异是平均处理效应，这是不可观测到的个体层面的处理效果的中心趋势的估计。如果样本是从总体中随机构成，那么样本平均处理效应 (Sample Average Treatment Effect， SATE)也是总体平均处理效应 (Population Average Treatment Effect，PATE)的估计值。

虽然实验确保了潜在结果以及所有协变量在处理组和对照组中的等价分布，但是在观察性研究中，情况并非如此。在观察性研究中，处理组和对照组个体并不服从随机分布，因此处理个体可能取决于未观测到或不可观测的因素。观察到的因素可以在统计学上加以控制 (如通过回归或匹配) ，但是任何关于平均处理效应的估计都可能与不可观察因素混淆，这些因素影响了哪些个体接受了处理，哪些个体没有接受处理。

形式化定义Formal definition

为了形式化定义平均处理效应，我们定义了两个潜在的结果: y0(i)是个体i没有被处理时的结果变量的取值，y1(i)是个体i被处理时的结果变量的取值。例如，y0(i)是个体i没有被注射研究药物时的健康状态，y1(i)是个体i被注射药物时的健康状态。

个体i的处理效应定义为y1(i)–y0(i)=β(i) 。在一般情况下，这种处理效果在个体之间是不一样的。平均处理效果ATE的定义为

这里对总体中所有N数量个体的处理效应进行了聚合平均计算。

如果我们能观察到一个大型代表性样本中每个个体的y1(i)和y0(i)，我们可以简单地通过取样本中y1(i)–y0(i)的平均值来估计平均处理效应。然而，我们不能同时观察每个个体的y1(i)、y0(i)，因为每个个体不能同时被处理和不被处理。例如，在药物例子中，我们只能观察到个体接受过药物治疗的y1(i)和个体未接受药物的y0(i)。这是研究者们在评估治疗效果时面临的主要问题，并因此引发了大量与估计方法相关的研究。

估计Estimation

根据数据及其潜在环境的不同，我们可以使用许多方法来估计平均处理效应ATE。最常见方法包括:

自然实验 Natural Experiment

双重差分模型 Difference in Differences

断点回归设计 Regression Discontinuity Design

倾向评分匹配 Propensity Score Matching

工具变量估计 Instrumental Variables Estimation

示例An example

考虑一个失业群体，对其中一些个体给与政策干预（处理组），其余的不做任何处理（控制组）。现需要计算求职监控政策（干预）对失业期长短的影响: 平均来说，如果对个体进行求职监控（给与干预），失业期会缩短多少？在选择一种干预这种情况下，平均处理效应是处理组和对照组的失业时间长度的期望值（平均值）差异。

在这个例子中，平均处理效应为正值意味着就业政策延长了失业期，平均处理效应为负值表明就业政策缩短了失业期。平均处理效应等于零表明提供就业政策对失业期长短并没有任何利处或不利。判断一个平均处理效应估计值是否为可以区分的零值需要进行统计推断。

因为平均处理效应是对处理的平均效果估计，正值或者负值平均处理效应并不表明处理对任意特定个体是有益或者有害。因此，平均处理效应忽略了处理效应的分布。即使平均处理效应是正值，总体的部分个体也可能因为这种处理或者干预而使得情况变得更糟。

异质处理效应 Heterogenous treatment effects

一些研究人员将处理效果依赖于个体的情况称之为“异质性”。例如，上面提到的求职监控政策依赖于性别（男、女）或者是区域的不同。

一种异质处理效应的研究方法是将研究数据进行分组 (如按照男、女性别，或者区域进行划分) ，比较平均处理效果在子组内的效应差异。每个子组的平均处理效应被称为“条件平均处理效应”(Conditional Average Treatment Effect，CATE) ，也就是说，每个子组的平均处理效应被称为条件平均处理效应，以子组内的分类方式为条件。

这种研究方法存在的一个问题是，子组的数据可能比未分组的数据要少得多，没有足够数据进行分析。

也有一些利用随机森林检测异质处理效应的相关工作

编者推荐

书籍推荐

《统计因果推理入门》封面

统计因果推理入门对应英文Causal Inference in Statistics: A Primer

关于因果的讨论很多，但是许多入门的教材只是为没有统计学基础的读者介绍如何使用统计学技术处理因果性问题，而没有讨论因果模型和因果参数，本书希望协助具有基础统计学知识的教师和学生应对几乎在所有自然科学和社会科学非试验研究中存在的因果性问题。本书聚焦于用简单和自然的方法定义因果参数，并且说明在观察研究中，哪些假设对于估计参数是必要的。我们也证明这些假设可以用显而易见的数学形式描述出来，也可以用简单的数学工具将这些假设转化为量化的因果关系，如治疗效果和政策干预，以确定其可检测的内在关系。

Counterfactuals and Causal Inference: Methods and Principles for Social Research

课程推荐

因果科学与 Causal AI 读书会第二季

因果推断与机器学习领域的结合已经吸引了越来越多来自学界业界的关注，为深入探讨、普及推广因果科学议题，智源社区携手集智俱乐部将举办第二季「因果科学与CausalAI读书会」。本季读书会着力于实操性、基础性，将带领大家精读因果科学方向两本非常受广泛认可的入门教材。

1. Pearl, Judea, Madelyn Glymour, and Nicholas P. Jewell. Causal inference in statistics: A primer. John Wiley & Sons, 2016.（本书中译版《统计因果推理入门（翻译版）》已由高等教育出版社出版）

2. Peters, Jonas, Dominik Janzing, and Bernhard Schölkopf. Elements of causal inference: foundations and learning algorithms. The MIT Press, 2017.

读书会每周将进行直播讨论，进行问题交流、重点概念分享、阅读概览和编程实践内容分析。非常适合有机器学习背景，希望深入学习因果科学基础知识和重要模型方法，寻求解决相关研究问题的朋友参加。详情参见：连接统计学、机器学习与自动推理的新兴交叉领域——因果科学读书会再启航。