‍‍

在统计学中,中介模型试图通过引入第三个假设变量,即中介变量(也称为中介变量、中介变量或中介变量),来识别和解释自变量与因变量之间观察到的关系的基础机制或过程。与自变量和因变量之间的直接因果关系不同,中介模型所描绘的图景是自变量通过影响中介变量(不可观测)进而影响因变量。因此,中介变量的作用是澄清自变量和因变量之间关系的本质。


Baron and Kenny(1986)提出的中介效应(mediation)框架(简称BK框架)在社会心理和消费者行为等诸多社会科学研究中产生了十分深远的影响。


基于回归的分析的传统 BK 框架存在一些局限性。例如,Zhao et al.(2010)指出了BK框架存在的三点问题:

  • 第一,直接效应的缺失不应成为评价中介效应强度的标准;
  • 第二,寻找中介效应无需以X对Y存在显著的净效应为前提;
  • 第三,Sobel z检验的效力并不强,存在改进方式。

近年来,基于现代因果模型的因果中介分析框架缓解了部分问题,成为了中介分析研究热点。

目录


一、bk框架下的中介效应分析
二、因果中介分析
三、编者推荐
七、百科项目志愿者招募





BK 框架下的中介效应分析



Baron and Kenny (1986) 提出了形成一个真正的中介关系必须满足的几个条件如下:
1)让因变量对自变量进行回归,以确认自变量是因变量的显著预测因子,即 Y=β10=β11X+ε1 的回归系数 β1是显著的。

2)让中介变量对自变量进行回归,确认自变量是中介变量的显著预测因子,即 Me= β20+β21X+ε2的回归系数β21是最显著的。如果中介变量与自变量没有关联,那么它就不可能中介任何事物。

3)让因变量对中介和自变量同时进行回归,即 Y=β30+β31X+β32Me+ε3 的回归系数 β32 是显著的。并且β31的绝对值应该小于自变量的效应β11。从而确保了中介变量是因变量的重要预测因子,并且使得相对于第一步,自变量对结果的解释性降低。

中介变量可以解释两个变量之间观察到的全部或部分关系,如果中介变量的加入使自变量和因变量之间的相关性降为零,则中介的证据最大,也称为完全中介(full mediation)。而部分中介(partial mediation)是指不仅中介变量与因变量之间存在显著的关系,而且自变量与因变量之间也存在某种直接的关系。

我们采用Sobel’s test来检验中介变量加入后自变量与因变量之间的关系是否显著降低,从而评估中介效应是否显著。然而,这种方式的统计效力(Power)很低。因此,为了有足够的效力检测显著性影响,需要大的样本量。这是因为Sobel检验的关键假设是正态性假设。因为Sobel检验是根据正态分布来评估给定样本的,所以样本规模小和抽样分布的偏态可能会有问题(详见正态分布)。因此,MacKinnon et al .,(2002)所建议的经验法是,检测较小的效应需要1000个样本,检测中等效应需要100个样本,检测较大效应需要50个样本。基于自助法的检验能减少对样本量的依赖,见 Preacher and Hayes(2004)。





因果中介分析




固定(fixing)与条件化(conditioning)

中介分析量化了变量参与从原因到其结果的变化传递的程度。它本质上是一个因果概念,因此不能用统计术语来定义。然而,传统上,大量的中介分析是在线性回归的范畴内进行的。统计术语掩盖了所涉及关系的因果特征,这导致了一些困难、偏差(biases)和局限性(limitations)。而基于因果图(causal diagrams)和反事实逻辑的现代因果分析方法缓解了这些困难、偏见和限制。
这些困难的根源在于,在方法上,根据在回归方程中添加第三个变量所引起的变化来定义中介。虽然这种统计上的变化是伴随中介效应而来的附带现象。但这样的做法未能充分捕捉到中介分析的本质,即量化因果关系。

因果方法的基本前提是,当我们试图估计自变量X对因变量 Y 的直接影响时,并不总是适合对中介 M 进行“控制”(见上图)。对M进行“控制”的经典理论是,如果我们成功地阻止了M的变化,那么我们在Y中测量的任何变化都只能归因于X的变化,然后我们就有理由宣布观察到的效果是“X 对Y 的直接影响”。不幸的是,“控制M”并不能从物理上阻止M的改变;它只是把分析者的注意力集中在相等M值的情况下。而且,概率论的语言没有表示“阻止 M改变”或“物理上保持 M不变”的符号。唯一的运算是“以…为条件”(conditioning),这是当我们“控制”M时所做的。或者为Y的方程添加 M作为其中的一个回归变量。结果是,与在物理上保持不变(例如M=m)并将X=1下Y 的单位 与X=0下Y 的单位进行比较的方法不同,我们允许 M变化但忽略所有使得M=m的其他单位。这两个操作除了没有遗漏变量的情况,本质上是不同的,产生不同的结果

举例来说,假设M 和Y 的误差项是相关的。在这种情况下,通过对Y 在X和M 上进行回归,就无法对结构系数B和A (在 M和Y 之间,在Y和X之间) 进行估计。事实上,即使当C等于 0 的时候,回归斜率也可能不等于 0 。这有两种后果。首先必须设计新的策略来估计结构系数A、B和C。其次,直接和间接效应的基本定义必须超越回归分析,并且应该采用类似于“固定M”的操作,而不是“在M的条件下”的操作。

数学定义

Pearl(1994)中定义了这样一个运算符do(M=m),它的作用是去除M的方程,代之以一个常数m。例如,如果基本中介模型由以下方程组成:
X=f(ε1),M=g(X,ε2),Y=h(X,M,ε3),那么应用了do(M=m)运算的模型将会变为:X=f(ε1),M=m,Y=h(X,m,ε3),同时,应用了do(X=x)运算的模型会变为:X=x,M=g(x,ε2),Y=h(X,M,ε3)其中函数 f 和 g 以及误差项 ε1 和 ε3的分布保持不变。如果我们进一步将do(X=x)得到的变量M和Y分别重新命名为M(x)和Y(x) ,我们得到了所谓的“潜在结果(potential outcome)”或“结构反事实(structural counterfactuals)”。

这些新变量为定义直接和间接效应提供了便利的描述符号。具体来说,定义了从X=0到X=1变化的四种效应:
(a) 总体效应 –TE=E[Y(1)-Y(0)]
(b) 受控直接效应 –CDE(m)=E[Y(1,m)-Y(0,m)]
(c) 自然直接效应 – NDE=E[Y(1,M(0))-Y(0,M(0))]
(d) 自然间接效应 NIE=E[Y(0,M(1))-Y(0,M(0))]

其中E[.]表示对误差项的期望,这些效应有如下一些解释:-TE表示的X 对Y 的总体因果效应。-CDE表示在某个条件 M=m下,X 对Y 的因果效应。- NDE表示 X 对Y 的直接产生的因果效应。- NIE表示 X对Y 的通过中介变量 M产生的因果效应。- 对于解释 X和Y之间的效应,两个效应的差TE-NDE度量的是中介变量在何种程度上是必要的。而 NIE度量的是引入中介变量在充分性。间接效应的受控版本并不存在,因为没有办法通过将一个变量固定到一个常量来屏蔽直接效应。根据这些定义,总体效应可以如下分解TE=NDE-NIEr,其中 NIEr表示在 NIE的定义中进行X=1到X=0的反向转换;线性系统中总体效应等于直接效应与间接效应之和,即负的反转间接效应等于间接效应-NIEr=NIE。这些定义的力量在于它们的普适性;它们适用于具有任意非线性相互作用,任意干扰之间的依赖关系,以及连续变量和离散变量的模型。

中介效应公式

在线性分析中,所有的效应由结构系数的乘积决定,给出:
因此,当模型被识别时,所有的效应都是可估计的。在非线性系统中,估计直接和间接效应需要更严格的条件,如不存在混杂因子(即ε1、ε2、ε3相互独立),可推导出如下公式:
TE=E(Y|X=1)-E(Y|X=0)
CDE(m)=E(Y|X=1,M=m)-E(Y|X=0,M=m)

后两个方程被称为中介公式。

已成为许多中介研究的估计对象。他们给出了直接和间接效应的无分布假设(distribution-free)表达式,并证明,尽管误差分布和函数f,g,h的性质难以确定,中介效应仍然可以通过使用回归方法利用数据来估计。调节中介和中介调节的分析属于因果中介分析的特例。中介公式确定了各种相互作用系数如何贡献于中介的必要和充分成分。

简单案例

假设模型采用这种形式:
其中,参数c3量化了 M 对 X 对 Y 的影响的修正程度。即使所有参数都是从数据中估计出来的,仍然不清楚是哪些参数组合度量了 X 对 Y 的直接和间接影响,或者,更实际的是,如何评估由中介解释的总体效应 TE 的比例以及应归功于中介效应的 TE 的比例。在线性分析中,前者被b1c2/TE所捕获,后者被差值(TE-c1)/TE所捕获,并且这两个量重合。然而,在存在交互的情况下,每个部分都需要单独的分析。如中介公式所规定的那样,其结果是:

因此,对于中介变量来说足够输出的部分是

而需要中介的部分是
这些分数涉及模型参数的微妙的组合,并且可以在中介公式的帮助下机械地构造。值得注意的是,由于交互作用,即使参数c1为 0,直接效应也可以存在。而且,即使直接和间接效应都为 0,总效应也可以存在。这说明孤立地估计参数几乎无法告诉我们中介的效果。更一般地说,中介和调节是交织在一起的,不能分开评估。





编者推荐


书籍推荐

《统计因果推理入门》封面

  • 统计因果推理入门 对应英文Causal Inference in Statistics: A Primer

这本书非常适合初学者入门因果科学,这里面涉及到对结构因果模型的详细定义和阐述,非常清晰易懂。


课程推荐

因果科学与 Causal AI 读书会第二季
因果推断与机器学习领域的结合已经吸引了越来越多来自学界业界的关注,为深入探讨、普及推广因果科学议题,智源社区携手集智俱乐部将举办第二季「因果科学与CausalAI读书会」。本季读书会着力于实操性、基础性,将带领大家精读因果科学方向两本非常受广泛认可的入门教材。

1. Pearl, Judea, Madelyn Glymour, and Nicholas P. Jewell. Causal inference in statistics: A primer. John Wiley & Sons, 2016.(本书中译版《统计因果推理入门(翻译版)》已由高等教育出版社出版)

2. Peters, Jonas, Dominik Janzing, and Bernhard Schölkopf. Elements of causal inference: foundations and learning algorithms. The MIT Press, 2017.

读书会每周将进行直播讨论,进行问题交流、重点概念分享、阅读概览和编程实践内容分析。非常适合有机器学习背景,希望深入学习因果科学基础知识和重要模型方法,寻求解决相关研究问题的朋友参加。详情参见:连接统计学、机器学习与自动推理的新兴交叉领域——因果科学读书会再启航


文章总结

  • Stata+R: 一文读懂中介效应分析

https://blog.csdn.net/arlionn/article/details/103853712

北京师范大学的沙莎同学分享在CSDN上的一篇文章,金额充好了如何用中介效应进行分析。

因果科学:连接统计学、机器学习与自动推理的新兴交叉领域
因果观念新革命?万字长文,解读复杂系统背后的暗因果
周晓华:因果推断的数学基础和在医学中的应用

相关路径

  • 因果科学与Casual AI读书会必读参考文献列表,这个是根据读书会中解读的论文,做的一个分类和筛选,方便大家梳理整个框架和内容。
    https://pattern.swarma.org/path?id=99
  • 因果推断方法概述,这个路径对因果在哲学方面的探讨,以及因果在机器学习方面应用的分析。
    https://pattern.swarma.org/path?id=9
  • 因果科学和 Causal AI入门路径,这条路径解释了因果科学是什么以及它的发展脉络。此路径将分为三个部分进行展开,第一部分是因果科学的基本定义及其哲学基础,第二部分是统计领域中的因果推断,第三个部分是机器学习中的因果(Causal AI)。
    https://pattern.swarma.org/path?id=90
  • 复杂网络动力学系统重构文献,这个路径是张江老师梳理了网络动力学重构问题,描述了动力学建模的常用方法和模型,并介绍了一些经典且重要的论文,这也是复杂系统自动建模读书会的主要论文来源,所以大部分都有解读视频。
    https://pattern.swarma.org/path?id=28
  • 因果纠缠集智年会——因果推荐系统分论坛关于因果推荐系统的参考文献和主要嘉宾介绍,来源是集智俱乐部的因果纠缠年会。
    https://pattern.swarma.org/path?id=114





百科项目志愿者招募



作为集智百科项目团队的成员,本文内容徐培用户参与编译,龚鹤扬参与审校,思无涯咿呀咿呀编辑。我们也为每位作者和志愿者准备了专属简介和个人集智百科主页,更多信息可以访问其集智百科个人主页。

以上内容都是我们做这项目的起点,作为来自不同学科和领域的志愿者,我们建立起一个有效的百科团队,分配有审校、翻译、编辑、宣传等工作。我们秉持:知识从我而来,问题到我为止的信念,认真负责编撰每一个词条。




在这里从复杂性知识出发与伙伴同行,同时我们希望有更多志愿者加入这个团队,使百科词条内容得到扩充,并为每位志愿者提供相应奖励与资源,建立个人主页与贡献记录,使其能够继续探索复杂世界。


如果你有意参与更加系统精细的分工,扫描二维码填写报名表,我们期待你的加入!



集智百科报名表


来源:集智百科

编辑:王建萍



推荐阅读


点击“阅读原文”,阅读中介分析词条原文与参考文献