导语


为了更多地推动因果推断学科的发展,聚集国内外因果推断的一线科研工作者,共同讨论因果科学的最新进展,北京大学讲席教授、北京大学公共卫生学院生物统计系主任、北京大学北京国际数学研究中心生物统计和信息研究室主任周晓华等发起了泛太平洋因果推断大会,会议于2021年9月17日至18日举行。泛太平洋因果推断大会是因果推断领域国际上最领先的会议之一。本次会议共邀请了37位嘉宾作报告,探讨因果推断领域的新进展。会议不仅设有专家学者报告,还发布了因果推理竞赛赛题(PCIC 2022华为因果推理挑战赛)。累计超过1000人次注册会议,超过3万人次观看会议直播。



以下我们为大家梳理了本次因果推断大会的报告摘要与参考资料。经过报告人的同意,后续我们会将部分回放与PPT资料公开在PCIC大会的官方网站(https://pattern.swarma.org/pcic/),敬请期待。
因果推断大会官方网站





专题一(Linbo Wang,Chair)




Estimating the Optimal Dynamic Treatment Regime with Restrictions using Observational Data

Lu Wang
最优动态治疗方案是在疾病治疗过程中非常重要的问题。在治疗过程中,医生需要根据治疗过程中搜集到的病人信息来决定下一步的治疗方法,从而达到最好的治疗效果。王教授在该方向提出了一系列方法来解决此类问题,比如基于决策树的强化学习方法(T-RL),该方法可以处理多值处理变量,且通过结合半参回归估计量和非参机器学习方法达到稳健有效估计。随后王教授又提出了随机决策树强化学习方法(ST-RL),该方法利用MCMC方法,不易过拟合。但是在实际应用过程中,往往会碰到一些限制,例如某些变量不应该用来作为决策依据,或者某些治疗方法对于将来的病人并不适用等。此时传统的方法并不能解决此类问题。因此王老师提出了新的强化学习方法(RT-RL),该方法在优化过程中将这些限制条件考虑在其中,从而能够解决实际应用过程中的问题。该方法在实际数据分析中取得了很好的效果。
参考文献:
Nina Zhou, Lu Wang, Daniel Almirall (2022) Estimating tree-based dynamic treatment regimes using observational data with restricted treatment sequences Biometrics


Fighting Noise with Noise: Causal Inference with Many Candidate Instruments

Dehan Kong
在孟德尔随机化研究中,传统做法是先通过相关性的强弱筛选出可能的工具变量,然后在通过2SLS方法找到多个因果作用的估计,最后以其中的众数作为估计量。然而在实际分析中,由于第一步的筛选过程,使得某些无关工具变量与处理变量有可疑的相关性,最终导致估计量有偏。为了解决这个问题,孔教授提出利用通过生成伪变量来消除无关工具变量造成的偏差,并证明了该方法的理论性质。孔教授用该方法分析了BMI对于生活质量的影响研究中,得到了比之前方法更好的结果。
参考文献:
Xinyi Zhang, Linbo Wang, Stanislav Volgushev and Dehan Kong. (2022+). Fighting Noise with Noise: Causal Inference with Many Candidate Instruments.


Outcome-adaptive LASSO for confounder selection with time-varying treatments

Mireille Schnitzer
随时间变化的处理在生物统计领域是十分重要的研究方向。教授利用逆概率加权方法来估计关心的参数。由于模型中的协变量会随时间增加,在估计过程中,如何选择混杂变量使得估计量的方差减小同时不增加偏差是十分重要的问题。教授提出利用adaptive lasso方法来进行变量选择。为了在实际分析中能够使用该方法,教授提出了选择adaptive lasso方法中超参数的选取方法。该方法在模拟和实际数据分析中取得了良好的表现。同时教授在最后也提出了目前的方法的限制,例如依赖于参数模型,参数估计速率等。

Estimating heterogeneous treatment effects with right-censored data via causal survival forests

Yifan Cui
异质性因果效应在精准医疗,经济,心理,科技平台等领域都有着广泛的应用。崔教授介绍了最近将因果森林应用于生存分析的工作。通过假定删失时间与生存时间条件独立,异质性生存时间差异能够在可忽略性等假定下得到识别。在得到参数的识别性后,崔教授提出利用逆概率加权因果森林方法,以及增广逆概率加权方法(augmented IPW)。最后将提出的方法使用到了关于高血压的实际数据分析中。


The synthetic instrument

Linbo Wang
多处理存在时的因果推断在最近引起了很多关注。当存在未观测混杂时, 王教授考虑了线性模型下因果作用的估计问题。在多处理满足因子模型,且多个处理中有部分处理对于结局没有因果作用时,王教授提出了合成工具变量的估计方法。该方法可以解决高维处理存在时的估计问题,并在模拟中具有良好的表现。





专题二(Jinzhu Jia,Chair)




No Star Is Good News: A Unified Look at Rerandomization Based on P-Values from Covariate Balance Tests

Anqi Zhao, National University of Singapore
随机对照试验在平均意义下平衡所有协变量,为评估治疗效果提供了金标准。然而,机会不平衡或多或少地存在于已实现的治疗分配中,使随后的推断可能具有较大的波动性。现代科学出版物要求报告协变量平衡表,不仅包括治疗组和对照组的协变量均值,还包括两组之间其差异显著性检验的相关p值。在实际需求中,我们需要避免小p值带来的协变量在对照组和治疗组之间不平衡的现象,从而减少后续对治疗效果估计的偏差。避免小p值的实际需求使得通过假设检验进行协变量的平衡检查和再随机分析成为改善随机对照试验中协变量平衡的一个有吸引力的工具。我们研究了基于协变量再平衡测试的p值(Rerandomization based on p-values, ReP)的各种可能有用的再随机方案,与不进行再平衡的方案进行比较,并证明了它们对后续统计推断的影响,其中主要进行比较的三种估计量分别是只考虑分组信息的Neyman估计量、考虑协变量信息的Fisher估计量、以及考虑交互作用的Lin估计量。我们的主要发现有两方面。首先,在所有检查的ReP方案下,考虑完全相互作用回归的Lin估计量是渐近最有效的,并且允许方便的回归辅助,Lin估计量的统计推断结果在ReP框架下和在完全的随机化框架下是一致的。其次,ReP不仅提高了协变量平衡,还提高了Neyman估计量和Fisher估计量的效率。
参考文献:
Zhao, A., & Ding, P. (2021). No star is good news: A unified look at rerandomization based on p-values from covariate balance tests. arXiv preprint arXiv:2112.10545.


Design-based theory for cluster rerandomization

Hanzhong Liu, Tsinghua University
完全随机化平均平衡协变量,但在有限样本中往往存在协变量不平衡。再随机化可以通过删除部分治疗分配方案来确保已实现实验中的协变量平衡。由于后勤限制或政策考虑,公共卫生和社会科学领域的许多实地实验将治疗安排在集群一级。此外,它们经常在设计阶段与再随机实验组合。我们将聚类再随机化定义为一个与再随机化相结合的聚类随机实验,以平衡个体或聚类水平上的协变量。现有的渐近理论只能处理在个体水平上分配的处理的再随机化,这使得集群再随机化成为一个开放问题。为了填补这一空白,我们提供了一种基于设计的簇重随机理论。此外,我们比较了两种使用关于协变量重要性的先验信息的聚类再随机方案:一种基于加权欧几里德距离,另一种基于具有协变量层的马氏距离。我们证明了前者在最优权重和正交化协变量情形下显著优于后者。最后,我们讨论了协变量调整在分析阶段的作用,并推荐了可通过最小二乘法(利用相关的稳健标准误差)来方便实施的协变量调整程序。
参考文献:
Lu, X., Liu, T., Liu, H., & Ding, P. Design-based theory for cluster rerandomization. Biometrika. Forthcoming.


Identification of Linear Latent Hierarchical Structure

Feng Xie, Beijing Technology and Business University
传统的因果发现方法主要侧重于估计测量变量之间的因果关系,但在许多现实问题中,如基于问卷的心理测量研究,测量变量是由因果相关的潜在变量生成的。在这篇演讲中,我们将研究发现隐藏的因果变量和估计因果结构的问题,包括潜在变量之间的因果关系以及潜在变量和测量变量之间的关系。我们放松了常用的测量假设,允许潜在变量的子变量也是潜在的,因此处理一种特定类型的潜在层次因果结构。特别地,我们定义了一个最小潜在层次结构,并证明了对于具有最小潜在层次的线性非高斯模型,整个结构仅可从测量变量识别。此外,我们开发了一种原理方法,通过以特定方式测试广义独立噪声(Generalized Independent Noise, GIN)条件来识别结构。通过在合成数据和真实数据进行充分的实验,我们证明了所提出的方法的有效性。我们的方法不仅仅为结构可识别性提供充分条件,同时基于理论推导和实验论证了学习线性潜在层次结构的重要性。
参考文献:
Xie, F., Huang, B., Chen, Z., He, Y., Geng, Z., & Zhang, K. (2022). Identification of Linear Non-Gaussian Latent Hierarchical Structure. In International Conference on Machine Learning (pp. 24370-24387). PMLR.


Paradoxes and resolutions for semiparametric data fusion with individual data and summary statistics

Wang Miao, Peking University
假设我们有来自内部研究的个体数据和来自相关外部研究的各类汇总统计数据。外部汇总统计量被用作内部数据分布的5个约束条件,这有助于改进统计推断;然而,这种数据整合会产生矛盾的结果:如果汇总统计数据的不确定性不可忽略,则可能会发生效率损失,如果从内部研究的不同人群中获得,则可能出现估计偏差。我们在半参数框架中研究了这些矛盾的结果。我们建立了估计内部数据分布的一般函数的半参数效率界,证明了其不大于仅使用内部数据的效率界。我们提出了一种数据融合的有效估计量,该估计量达到了这个界限,从而解决了效率悖论。该初始数据融合的有效估计量通过自适应lasso惩罚进一步正则化,从而导致的估计器可以实现与仅使用无偏汇总统计的oracle估计器相同的渐近分布,这解决了偏差悖论。我们分别在模拟数据和对幽门螺杆菌感染数据中应用了我们的方法,其结果证明了所提出的方法的有效性。





专题三(Theis Lange,Chair)




Continuous-time TMLE for multivariate causal parameters in time-to-event settings

Helene Charlotte Wiese Rytgaard
目标学习(TMLE)是一种将机器学习与渐近统计推断相结合的因果参数半参有效替代估计的一般方法。连续时间TMLE是在纵向数据中目标学习方法的一般化,在纵向数据设定中,干预、协变量和结果可以发生在任何特定的时间点。报告人考虑了经典的时间-事件设定——治疗前的协变量可能对基线治疗决策和结局起混杂作用,并特别关注在不同时间和事件类型下如何同时估计生存概率和绝对风险概率。所提出的估计量不仅是渐近线性、有效、遵循由非参数有效影响函数完全表示的渐近分布,而且还保证了参数空间的约束条件,如单调性以及概率和为1。

Drop-in of concomitant medication

Edwin Fong
临床试验中的随机化确保了治疗分配无混杂,但随机化后发生的并发事件可能是不平衡的。在糖尿病临床试验中,伴随用药是一个关键的并发事件。报告人认为传统的感兴趣的量和估计方法,不能直接处理有伴随用药时的临床试验。因此提出了更适合该情形的被估量,并在序贯可忽略性假设下使用纵向目标最大似然估计(LTMLE)来处理治疗组和安慰剂组之间伴随用药的不平衡。该方法可以拓展到存在竞争风险和右删失的情形,并在模拟数据中取得了较好效果。

A Cross-Validated Targeted Maximum Likelihood Estimator for Data-Adaptive Experiment Selection Applied to the Augmentation of RCT Control Arms with Observational Data

Lauren Dang
当无法进行大规模的随机临床试验时,使用外部数据增可能会增加功效,但有产生偏倚的风险。现有的组合数据来源的方法通常依赖于严格的假设,或者在存在偏倚的情况下可能反而降低功效。报告人提出了交叉验证的目标最大似然估计(CV-TMLE)方法来数据自适应地选择最优方案——只用RCT(如果不存在无偏外部数据)或用RCT和外部数据。算法将经验分布映射到方案选择器中,该选择器可优化感兴趣的因果效应的偏差-方差权衡。报告人使用模拟RCT数据和有不同程度偏差的外部数据,估计平均治疗效果。CV-TMLE相比其他方法(包括仅RCT)相比覆盖率接近,而功效明显增加。

Generalisability and transportability in the context of target trial emulations

Kim Katrine Bjerring Clemmense
2016年,Hernan和Robins正式提出了观测数据分析的目标试验方法。目标试验是我们为了回答我们感兴趣的问题而进行的假想随机试验。使用这种方法,观察数据的分析可以被视为模拟目标试验的一种尝试。报告人简要介绍了目标实验法,并举例说明了该方法如何用于随机对照试验结果的可泛化性和可移植性问题。





专题四(Lu Wang,Chair)




Controlling weak instrument bias in multivariable Mendelian randomization using empirical shrinkage

Jean Morrison
教授首先回顾了孟德尔随机化研究中利用汇总数据的传统方法,例如逆方差加权方法和极大似然方法等。当存在基因多效性时,已有的方法有Egger回归,中位数回归等。然后教授提出做多元孟德尔随机化研究。该方法可以同时研究多个性状对于疾病的影响。然而当性状过多时,在选择需要控制的混杂变量时,会导致最后的估计产生偏差。为了解决该问题,教授提出了基于变分贝叶斯算法的计算方法(ESMR),与之前的逆概率加权方法和GRAPPLE方法相比较,新方法能够控制偏差在小范围内,同时计算时间较短,该新方法在模拟中展示出较好的性质。

A Bayesian Reinforcement Learning Framework for Optimizing Sequential Combination Antiretroviral Therapy in People with HIV

Yanxun Xu
由于在HIV治疗中的需要,序贯决策问题具有很强的实用价值。但是在估计决策的因果作用时,有许多技术上的困难。首先高维的状态空间很难估计,数据不平衡问题也十分严重,此外如何从巨大的决策空间中得到一个实用的决策方案也难以解决。为了解决这些问题,许教授提出利用贝叶斯动态模型来拟合整个动态过程,然后利用惩罚项来处理环境中的限制条件,在使用线下强化学习方法优化目标函数,最终得到需要的序贯决策方案。该方法在实际应用中对于疗效有了显著的提升。

Constructing stabilized dynamic surveillance rules for optimal monitoring schedules

Yingqi Zhao
前列腺癌是男性中第二常见的癌症,主动监测在其中发挥重要作用。赵教授定义了一种动态监测规则(Dynamic Surveillance Rule, DSR),并结合真阳性分数与假阳性分数作为评价标准。赵教授主要关注稳定线性规则,该类规则有三个特点:一是规则公式不随时间变化;二是个体是否被建议监测可因随时间变化的协变量变化而变化;三是在实际中容易实现。在此基础上,赵教授给出两种算法,一是共享建模(Shared modeling)法,二是优化代理函数(Optimization with surrogate function)法。最后模拟数据和Canary PASS数据验证了方法的有效性。




专题五(Robin Evans,Chair)




On structural imsets for describing and learning graphical models

Milan Studený   Academy of Sciences of the Czech Republic
Studený教授的演讲是结构性imsets方法的简要回顾,该方法可以用来描述离散随机变量的条件独立结构。Imsets是由N个变量的基本集合的子集编码的整数组成的特殊向量。讲座重点强调了描述条件独立结构的图模型,引出并介绍了整数线性规划的方法来学习可分解的图模型的结构。

Towards standard imsets for maximal ancestral graphs

Zhongyi Hu    Department of Statistics, University of Oxford
Imset是表示条件独立模型的代数方法。在条件独立模型中,Imsets有吸引人的性质,并且很适合与有向无环图一起使用。特别地,一个有向无环图的标准的imset和它所表示的独立性结构是一一对应的,因此标准的imset也是马尔科夫等价类的标签。
胡仲易老师针对最大祖先图(MAG),使用“parameterizing set representation”拓展了标准的imset,这样,构造出的imset也能够代表最大祖先图的马尔科夫等价类。对很多图来说,新提出的imset是满足马尔可夫性的,因此能够通过度量一系列的独立性差异来提供一种评分准则,这就给了我们一种BIC评分以外的选择。然而,在有些模型下这一表征并不成立,并且在一些情况下也不能代表任何独立性,因此,胡仲易老师接着证明了在一些简单的图下这一表征确实成立,并且是最简单的一种。最后,演讲介绍了有序局部马尔科夫性的改进方法,并且用它来找到能够表示最大祖先图的最佳的imset。


Using imsets to score causal models with latent confounding

Bryan Andrews  Department of Philosophy, Carnegie Mellon University
在统计和机器学习中,有向无环图(DAG)被广泛地研究和应用,它们是学习和推断的简便有效的方法。然而,这一类模型并不能很好地处理有潜在的混杂的系统。有向无环混合图模型(ADMG)描述了有向无环图模型的边缘特征,因此他们更适用于处理这一类有潜在混杂的系统。然而,ADMG模型因其复杂性而至今没有得到广泛的应用。
在Andrews教授的讲座中,他探讨了将有向无环图模型的特征imset拓展到有向无环混合图模型的方法。进一步,Andrews教授讨论了这一拓展后的ADMG模型的分解标准,以及它与全局马尔科夫性质的等价性。最后,讲座展示了一个相合得分准则,并将其用于学习ADMG,以展示分解方法的实用性。


Imsets and supermodular functions

James Cussens   Department of Computer Science, University of Bristol
Supermodular函数为描述条件独立结构,在imsets以外,提供了一种二元的替代方法。在这一讲座中,Cussens教授讲述了imsets和supermodular函数之间的关系,探索了用supermodular函数来描述条件独立关系的利弊。一方面,对一个条件独立关系来说,相比于imset,用supermodular函数来检验这一关系是否成立是更加容易的。此外,计算边缘supermodular函数也更加简单。另一方法,现如今还没有一种标准的supermodular函数能够用来代表贝叶斯网络结构,然而imset有。任何一个拟阵的秩函数即是一个submodular函数,因此拟阵可以为特定的supermodular函数提供紧的表示。Cussens教授研究了如何探索这一supermodular函数与拟阵的关联。




专题六(Xiao-Hua Zhou,Chair)




Total causal effects in MPDAGs: identification and minimal enumeration

Emilija Perkovic, University of Washington
当因果图不完全已知时,总因果作用可能无法识别。报告人考虑最大定向有向无环图(Maximally oriented partially directed acyclic graph, MPDAG),其中有一些边的方向未知。目前在因果图上识别因果作用的方式有两种:一是调整规则,它是在DAG或MPDAG上识别因果作用的充分条件;二是G-公式即截断分解,它是在DAG上识别因果作用的充分必要条件,但尚未推广到MPDAG上。报告人提出了在DAG或MPDAG上识别因果作用的充分必要条件:处理变量到结局变量的正常因果路径都以直接边开始。在此条件下,报告人给出了因果作用的截断分解公式。另外,当因果作用不可识别时,报告人给出了通过递归枚举所有可能因果作用的算法。
参考文献:
Perkovic, E. (2020). Identifying causal effects in maximally oriented partially directed acyclic graphs. In Conference on Uncertainty in Artificial Intelligence (pp. 530-539). PMLR.


A simple asymptotic non-conservative test for indirect effect

Gary Chan, University of Washington
在中介分析中,处理变量可通过直接路径和间接路径影响结局。有时我们希望检验间接作用是否存在。在线性结构方程模型中,对间接作用的检验可以写成H(0):θ(1)θ(2)=0。这是一个复合检验,因为在原假设下θ(1)或θ(2)都可能等于0。Sobel检验是Wald类型的检验,当θ(1)和θ(2)二者都为0时检验统计量的渐近方差会过小。记检验θ(1)=0和θ(2)=0的p值分别为p(1)和p­(2),在正态模型下,该检验的似然比检验要求当p(1)和p(2)的最大值较小时拒绝原假设。报告人提出了基于p值的检验,使得在原假设下,统计量收敛[0,1]上的均匀分布,原假设不成立时统计量收敛到0,新统计量可被看作是原始复合检验的p值。新检验不会遇到第一类错误率过小的问题,在样本量较小时比现有方法具有更高的功效,但在小样本下稍有第一类错误率膨胀。进一步,报告人把这一思路推广到多个参数乘积为0检验的情形。


Testing an Elaborate Theory of a Causal Hypothesis

Dylan Small, University of Pennsylvania
当R.A.Fisher被问及在观察性研究中如何才能澄清从关联到因果关系的步骤时,他回答说:“使你的理论更加详尽”——在构建一个因果假设时,尽可能多地设想其假设的不同后果,并规划观察性研究以发现这些后果中的每一个是否成立。William Cochran称“这种多阶段的攻击……是观察性研究中最有力的武器之一”。对精心设计的理论的各个部分进行统计检验,有助于澄清因果假设的确证程度。在实践中,因果假说的确证程度是通过口头描述哪种检验为哪种预测提供证据来评估的。这种口头上的方法可能会错过定量的模式。报告人开发了一种定量的方法,对有证据支持的详细理论的数量进行统计推断。更具体地,报告人以具体数据为背景,考虑了若干个独立的检验,使用部分连接检验结合这些检验的证据。当待比较处理组和对照组间存在偏倚时,也可以执行敏感性分析,汇报特定程度偏倚下的最大可能p值。
参考文献:
Karmakar, B., & Small, D. S. (2020). Assessment of the extent of corroboration of an elaborate theory of a causal hypothesis using partial conjunctions of evidence factors. The Annals of Statistics, 48(6), 3283-3311.





专题七(Wang Miao,Chair)




On Mendelian Randomization Mixed-Scale Treatment Effect Robust Identification and Estimation for Causal Inference

Zhonghua Liu, Columbia University
在孟德尔随机化研究中,如果作为工具变量的遗传变体与感兴趣的结局存在混杂,而不是由治疗变量介导的,或者对感兴趣的结局水平有多态性影响,那么标准的孟德尔随机化分析就会产生有偏的结果。报告人通过利用一个可能无效的工具变量,为暴露的因果效应提供了新的识别条件,这里工具变量的独立性和排除限制假设都可能被违反。提出的孟德尔随机化混合尺度治疗效果稳健识别(MR MiSTERI)方法依赖于(i)假设治疗效果不随加可尺度上可能无效的工具变量而变化;(ii)混杂偏倚不随几率比尺度上可能无效的工具变量而变化;以及(iii)结局的残差相对于可能无效的工具变量是异方差的。尽管假设(i)和(ii)已经分别出现在工具变量文献中,但假设(iii)还没有出现;我们正式提出,即使有无效的工具变量,它们的结合也能识别因果效应。MR MiSTERI被证明在存在可加尺度的多因子效应的普遍异质性时特别有优势。我们提出了一个简单而相合的三阶段估计量,可以作为精心构建的高效一步更新(one-step-update)估计量的初步估计量。为了纳入多个可能相关的弱无效工具变量——这是MR研究中常见的挑战,报告人及同事开发了一个多重弱无效工具变量(MR MaWII MiSTERI)方法,以加强识别和提高估计准确度。模拟研究和UK Biobank分析结果都证明了所提方法的稳健性。
参考文献
Liu, Z., Ye, T., Sun, B., Schooling, M., & Tchetgen, E. T. (2022). Mendelian randomization mixed‐scale treatment effect robust identification and estimation for causal inference. Biometrics.


DNN-Based Causal Inference and New Stable Empirical Higher Order Influence Functions

Lin Liu, Shanghai Jiao Tong University
深度神经网络(DNN)已经在各种统计问题上取得了成功,从图像分类到解决非线性反问题。近年来,也有越来越多的文献研究DNN如何很好地学习因果效应。在这次演讲中,报告人表明,目前的理论结果在很大程度上不令人满意,可能是由于DNN训练过程中的隐性偏倚。作为部分补救措施,在Liu等人(2020)的文章中,开发了一个基于高阶影响函数(HOIF)的假设检验程序,可以探测因果效应估计值的偏差,而不受真实或估计的冗余函数属性的影响。但所提出的程序有许多尚未解决的问题,在报告的后半部分,报告人介绍新的数值稳定的经验高阶影响函数。新的高阶影响函数与之前提出的高阶影响函数具有非常相似的渐进特性,但却享有更好的有限样本特性。最后,通过模拟研究证明改进的有限样本性能。

Causal mediation analysis with Mendelian Randomization

Jingshu Wang, University of Chicago
了解常见疾病的致病机制是临床研究的一个基本目标。由于随机对照实验并不总是可行的,孟德尔随机化(MR),使用自然遗传突变作为工具,已经成为探究常见疾病因果机制的一个流行的替代方法。然而,目前的MR方法通常忽略了风险因素和疾病进展之间的时间关系。在本讲座中,我将讨论一种基于孟德尔随机化的统计方法,以评估一连串风险因素在时间顺序上对后来疾病状况的因果调解效应。为了提高效率和稳健性,我们的框架是基于一个完整的贝叶斯框架,并允许调整多态性效应。我将在模拟和真实数据案例研究中说明我们方法的性能。


Safe Policy Learning through Extrapolation

Zhichao Jiang, Sun Yat-sen Univeristy
基于算法的建议和决策在当今社会已经无处不在了。许多这些和其他数据驱动的政策都是基于已知的、确定的规则,以确保其透明度和可解释性。当这些政策被用于公共政策决策时,情况尤其如此。例如,作为我们的激励性应用的审前风险评估算法,提供了相对简单、确定的分类分数和建议,以帮助法官做出释放决定。不幸的是,现有的政策学习方法并不适用,因为它们要求现有的政策是随机的而不是确定性的。我们开发了一种稳健的优化方法,它可以部分地确定政策的预期效用,然后通过最小化最坏情况下的损失找到一个最佳政策。由此产生的政策是保守的,但有统计学上的安全保证,允许政策制定者限制产生比现有政策更糟糕的结果的概率。最后,报告人将提出的方法应用于一个独特的审判前风险评估的现场实验。
参考文献:
Ben-Michael, E., Greiner, D. J., Imai, K., & Jiang, Z. (2021). Safe Policy Learning through Extrapolation: Application to Pre-trial Risk Assessment. arXiv preprint arXiv:2109.11679.


Evaluating Causes of Effects by Posterior Effects of Causes

Jinzhu Jia, Peking University
对于单一因果变量的情况,Dawid等人(2014)定义了因果概率,Pearl(2000)定义了必要性概率来评估效应的原因。对于有多个可能相互影响的原因的情况,本文根据观察到的治疗后变量的证据,定义了后验总因果效应和直接因果效应,这可以被看作是对效应原因的测量。后发因果效应涉及反事实变量的概率。因此,与因果概率、必要性的概率和直接因果效应一样,后验总因果效应和直接因果效应的可识别性比传统的以治疗前变量为条件的因果效应的可识别性需要更多的假设。我们提出了后发因果效应的可识别性所需的假设,并提供了识别方程。此外,当多个原因和一个终点之间的因果关系可以用因果网络来描述时,我们可以简化所需的假设以及后验总因果效应和直接因果效应的识别方程。最后,通过数字实例,我们将后验总效应和直接因果效应与其他评估效应原因和人群归因风险的措施进行了比较。
参考文献:
Lu, Z., Geng, Z., Li, W., Zhu, S., & Jia, J. (2022). Evaluating Causes of Effects by Posterior Effects of Causes. Biometrika.


Retrospective causal inference with multiple effect variables

Wei Li, Renmin University of China
正如Dawid(2000)和Pearl & Mackenzie(2018)所强调的,在因果推断中,推导给定效果的原因是一个比评价原因的效果更具挑战性的问题。Lu等人(2022)提出了一种基于后验因果效应推导单一效应变量的原因的方法。在许多应用中,有多个效应变量,因此可以同时使用它们来更准确地推导原因。为了从多个效应中回顾性地推导出原因,我们提出了以观察到的证据为条件的多变量后验总效应、干预效应和直接因果效应。我们描述了无混杂和单调性的假设,在此假设下,我们证明了多变量后验因果效应的可识别性,并提供了其识别方程。当原因和结果之间的因果关系由因果网络描述时,假设和识别方程都可以简化。所提出的方法可以应用于有多个效应或结果变量的各种研究中的因果归属、医疗诊断等。





专题八(Kun Kuang,Chair) 




Learning Causal Representations for Generalization in Reinforcement Learning

Chaochao Lu, University of Cambridge & Max Planck Institute for Intelligent Systems
模仿学习和强化学习的一个基本挑战是学习政策、表征或动态,这些政策、表征或动态不建立在虚假的相关关系上,并能超越它们被训练的特定环境。我们从一个统一的角度来研究这些泛化问题。为此,我们提出了一个通用的框架来解决这些问题,在环境变化的温和假设下,在理论上保证可识别性和泛化性。通过利用一组不同的训练环境,我们构建了一个数据表示法,该表示法忽略了任何虚假的特征,并在不同的环境中一致地预测目标变量。按照这种方法,我们在策略、表示和动态方面建立了不变的预测器。我们从理论上表明,所产生的政策、表示和动态能够推广到未见过的环境。在合成和真实世界的数据集上进行的广泛实验表明,我们的方法比各种基线达到了更好的泛化效果。

Causal Inference with Instrumental Variables

Kun Kuang, Zhejiang University
因果问题存在于许多领域,如医疗保健、经济学、政治学、数字营销等。与旧的药物相比,一种新的药物是否能使某种疾病的治疗效果更好?一种新的营销策略是否能提高某种产品的销量?所有这些问题都可以通过因果推理技术来解决。因果推断的金标准方法是随机实验,例如A/B测试。然而,完全随机化的实验通常非常昂贵,有时甚至不可行。因此,开发自动统计方法来推断观察性研究中的因果效应是非常困难的。
本次报告展示了大数据场景下因果推断的一些新挑战,包括(1)高维和噪声变量,(2)未观察到的混杂因素,以及(3)复杂的治疗变量。我们将主要关注来自未观察到的混杂因素的挑战,并介绍最近在因果推断和机器学习界提出的IV方法。具体来说,我们首先介绍如何结合混杂因素平衡技术和IV回归模型来实现混杂因素平衡IV回归。然后,我们将讨论如何从观察到的变量中生成一个表征来服务于IVs的作用。最后,我们将介绍如何用Meta-EM算法从数据融合中学习潜在的群体IV,以进行存在未观察到的混杂因素的因果推断。





专题九(Kun Zhang,Chair)




Causal Inference of Truncation-by-Death with Unmeasured Confounding

Xiao-Hua Zhou, Peking University
临床研究经常遇到死亡截断的情况,这可能使一些结果无法确定。仅仅基于观察到的幸存者的统计分析可能会导致有偏差的结果,因为不同治疗组的幸存者的特征可能不同。在这种情况下,常用的有意义的因果参数是幸存者平均因果效应(SACE),当治疗分配和生存或结果过程之间存在无法测量的混杂时,该参数可能无法识别。在本报告中,我们首先表明,在适当的假设条件下,基于替代变量的幸存者平均因果效应是可以识别的。接下来,我们为这个估计值提出了一个增强的逆概率加权(AIPW)类型的估计器,对模型的错误指定具有鲁棒性。最后,建议的方法被应用于研究异体干细胞移植类型对白血病复发的影响。

Causality-inspired ML: what can causality do for ML?

Sara Magliacane, University of Amsterdam & Research Scientist at IBM Watson AI Lab
将机器学习应用到现实世界的案例中,往往需要对异质性、非随机缺失或损坏的数据、选择偏差、非i.i.d.数据等具有鲁棒性的方法,并且能够在不同领域中进行推广。此外,许多任务本质上是试图回答因果问题并收集可操作的见解,对于这项任务来说,相关关系通常是不够的。在丰富的因果推理文献中,这些问题中有几个得到了解决。另一方面,通常经典的因果推断方法需要对因果图有完整的了解,或者需要有足够的实验数据(干预)来准确估计它。最近,一个新的研究方向集中在因果关系启发的机器学习上,即把因果推理的思想应用到机器学习方法上,而不一定知道或甚至试图估计完整的因果图。在这次演讲中,我将介绍在无监督领域适应情况下这一研究方向的一个例子,在这种情况下,我们有一组源领域的标签数据和目标领域(”zero-shot”)的无标签数据,我们想预测这些标签。特别是,考虑到某些假设,我们的方法能够选择一组被证明是 “稳定的”特征(分离集),对于这些特征,即使在任意大的分布变化的情况下,泛化误差也可以被约束。与其他工作不同的是,它还利用了未标记的目标数据中的信息,允许在源域中出现一些未见过的变化。虽然使用了因果推理的思想,但我们的方法从来不以重建因果图或甚至马尔科夫等价类为目的,这表明因果推理的思想甚至在这种更宽松的环境中也能帮助机器学习。

Efficient learning using privileged information with known causal structure

Fredrik Johansson, Chalmers University of Technology, Sweden
在样本量有限的领域,高效的学习是至关重要的。然而,对于许多机器学习问题,标准做法通常会留下大量未使用的信息。一个例子是根据基线时间点收集的变量预测一个时间序列结束时的结果,例如,一个病人入院后30天的死亡风险。在应用中,在基线和终点之间收集的中间样本被丢弃是很常见的,因为在使用学习模型时,它们不能作为预测的输入。我们说,这些信息是有特权的,因为它只在训练时可用。在这次演讲中,我们表明,利用已知的因果结构和中间时间序列的特权信息可以导致更有效的学习。我们给出了证明其优于经典学习的条件,以及支持这些发现的一系列经验结果。

Advances in causal representation learning

Kun Zhang, Carnegie Mellon University & Mohamed bin Zayed University of Artificial Intelligence
本讲座关注的是因果表征学习,其目的是揭示底层隐藏的因果变量及其关系。它可以被看作是因果发现的一个特例,其目标是从观察数据中恢复潜在的因果结构或因果模型。因果系统的模块化属性意味着因果表征的最小变化和独立变化的属性,我将解释这些属性如何使得从观察数据中恢复底层因果表征成为可能,并具有可识别性的保证:在适当的假设下,学到的表征与底层因果过程一致。该讲座将考虑以独立同分布(i.i.d.)数据、时间数据或有分布变化的数据作为输入的各种设置,并证明可识别的因果表征学习何时能从深度学习的灵活性中获益,何时必须对因果过程施加参数化的假设。




专题十(Thomas Richardson,Chair)




On prediction, action and interference in algorithmic fairness

Ricardo Silva, University College London
最终,我们希望通过改变世界来减少不公平。仅仅做出公正的被动预测是不够的,因此我们的决定最终将对社会系统的运作产生影响。我们将讨论模拟假设干预的方法,以便尊重反事实公平性的具体措施:即,敏感性属性如何与我们的行动相互作用,从而导致不公平的分配结果,在这种情况下,我们如何在可行的行动空间内减轻这种不平衡的影响?更为困难的是,干扰很可能发生:一个人发生的事情可能会影响另一个人。我们将讨论如何表达这些因果因素对公平决策的假设和后果,承认这是一项艰巨的任务,但我们应该向公众解释我们的推理。在讨论的最后,我们得出以下结论:公平最终是关于改变数据生成过程;通过修改预测模型的间接变化是有用的,但是理解它们的长期后果可能太难了;解决干预这一进程的问题可以带来更多即时和可预测的结果,即使这仍然是一个难题;反事实特权是量化不公平的一种方法。对于从业人员而言,需要在估计中利用不确定性以及考虑违反因果假设的稳健性。
参考文献:
Kusner, M., Russell, C., Loftus, J., & Silva, R. (2019, May). Making decisions that reduce discriminatory impacts. In International Conference on Machine Learning (pp. 3591-3600). PMLR.


Problems due to Selection and an Overcommitment to Ignorability in Causal Fairness

Jake Fawkes, University of Oxford
在这次报告中,我们讨论了哪些因果模型可以正确地捕捉公平问题中的因果特征。当前的方法捕捉了一个直观的概念,即如果预测与如果某人的种族、性别或宗教事实上相反,那么预测是公平的。我们首先指出,当前的因果公平文献通常致力于具有独立噪声和祖先封闭敏感属性的DAG。因此,我们认为这些假设往往过于强烈,无法捕捉到正确的因果特征,如反事实和因果效应。通常这些假设仅在随机对照试验中出现,我们认为,一般来说,这不太可能成立,这给反事实公平以及更一般的因果公平方法的应用带来了困难。我们的论点基于两点,即这些模型致力于可忽略性和公平性数据集产生于复杂的选择过程。我们推导了可忽略性必须满足的条件,并讨论了当该假设不成立时因果公平性的含义。
参考文献:
Fawkes, J., Evans, R., & Sejdinovic, D. (2022). Selection, Ignorability and Challenges With Causal Fairness. arXiv preprint arXiv:2202.13774.


A causal and counterfactual view of (un)fairness in automated decision making

Razieh Nabi, Emory University
尽管存在客观性错觉,但算法在其发展的每一步都利用了人类的主观判断。在自动化决策的背景下,一个特别令人担忧的问题是使不公正永久化,即当最大化“效用”维持、强化甚至引入敏感特征(如种族、性别、年龄、性取向)、决策和结果之间的不公平依赖时。因此,自动化决策必须尊重公平原则,特别是在医疗、社会福利和刑事司法等具有社会影响力的环境中。在本次演讲中,我们展示了如何使用因果推理和约束优化的方法,通过纠正决策和结果对敏感特征的不公平依赖,做出最优但公平的决策,从而“打破不公平的循环”。我们从三个方面循序渐进地解决自动化决策中的公平问题:首先,如何用数学表达公平原则?其次,如何修改统计程序以减少不公平影响?以及最后,如何推广和部署这些改进算法?值得注意的是,我们采取的方法需要来自专家和/或公众的大量的伦理输入,还需要指定基于领域知识或者因果结构学习后的因果模型,另外,我们的方法可以处理未确定的因果影响;在修改统计程序时,可以使用约束MLE(混合似然)或者开发更稳健的约束优化方法以供使用尽可能高效地收集数据;在推广和部署算法时,需要注意样本是在p而非p*中采集的。
参考文献:
Nabi, R., Malinsky, D., & Shpitser, I. (2022, June). Optimal training of fair predictive models. In Conference on Causal Learning and Reasoning (pp. 594-617). PMLR.

Causal determinants of postoperative length of stay in cardiac surgery using causal graphical learning

Daniel Malinsky, Columbia University
因果推理中的许多目标,包括估计平均治疗效果和理解特定路径机制,取决于了解某个领域的定性因果结构。在这项工作中,我们将图形因果发现方法(特别是FCI算法)应用于约翰·霍普金斯医院电子健康记录(EHR)形式的观察数据。我们的目标是了解心脏手术患者术后住院时间的因果决定因素,以便为支持患者更快康复的可能干预措施提供信息。对于2011年至2016年期间接受隔离CABG或隔离AVR手术的患者,我们使用了电子健康记录数据的因果图形建模。在给定临床背景知识的情况下,使用来自Tetrad软件的快速因果推理(FCI)算法对数据进行估计,以描述pLOS的直接和间接原因。然后,我们使用潜在变量IDA算法来估计感兴趣因果效应的强度。最后,我们对pLOS进行了一次线性回归,以将统计关联与因果分析所获得的结果进行对比。基于我们的方法,我们发现使用回顾性EHR数据和背景临床知识,因果图形建模检索了pLOS的直接和间接原因及其相对强度。这些见解将有助于设计临床方案和改善患者管理。此外,我们还讨论了将因果发现方法应用于电子健康记录的挑战和未来工作的机会。
参考文献:
Lee, J. J., Srinivasan, R., Ong, C. S., Alejo, D., Schena, S., Shpitser, I., … & Malinsky, D. (2022). Causal Determinants of Postoperative Length of Stay in Cardiac Surgery using Causal Graphical Learning. The Journal of Thoracic and Cardiovascular Surgery.




专题十一(Peng Cui,Chair)




Learning Causality with Graphs

Jundong Li  University of Virginia
学习因果性是人工智能一项重要的能力,并且可以作为人工智能的基础。在因果学习中,一项基本的问题是,如何理解一个特定的干预对一个重要的结果的作用,特别是在各种重要的领域,例如健康监测、教育、电子商务等等。解决这一问题的一种流行方法是直接使用观察性的数据,因为随机试验往往非常昂贵,费时,并且可能在一些情况下面临伦理问题。然而,现存的数据驱动的方法往往有以下局限性:(1)假设观察性数据是独立同分布的,甚至假设各个单元之间是没有相互影响的;(2)忽略了潜在的混杂的影响;同时,真实世界数据常常是相互连接的,并且可以被抽象为图,例如社交网络,生物网络,知识图谱等。无处不在的图的数据也给我们带来了控制潜在混杂影响、构建更有效的模型的机会,从而带来无偏的因果作用估计。在这一讲座中,Jundong Li老师介绍了现阶段使用图模型学习因果作用的有关工作。特别地,Jundong Li试图回答以下的科研问题:如何用观察性的数据来获取图的信息从而学习因果作用?在图不断更新的情况下,如何利用历史信息来控制潜在混杂的影响,从而更好地学习因果作用?

Emulating Clinical Trials with Large Scale Electronic Health Records

Fei Wang Cornell University
药物的发现和开发是耗时耗力的过程,提升临床试验的效率和准确性是制药产业的重中之重。近些年来,大估摸的真实世界病例数据,特别是纵向的电子病历记录受到了关注。这些数据包含了病例的治疗的有效性和安全性的有用信息。对这些信息的有效挖掘可以帮助我们更好地指导临床试验的设计。临床试验仿真指的是用真实世界病例数据来模仿临床试验的过程。由于这真实世界数据回顾性的特征,我们需要仔细地控制可能存在的混杂因素,从而估计个体因果作用。在这一讲座中,Fei Wang老师讲述了他近期利用模拟实验来识别治疗阿尔兹海默症有效药物的研究,以及利用模拟实验来识别新冠肺炎感染后遗症的潜在症状的研究,并且指出了相应的挑战和未来的研究方向。