因果推断学习笔记二

最新推荐文章于 2025-03-29 15:58:00 发布

原创

最新推荐文章于 2025-03-29 15:58:00 发布 · 4.2k 阅读

40 ·

CC 4.0 BY-SA版权

本文深入探讨了因果推断中的潜在结果框架，强调了潜在结果在区分相关性和因果关系中的关键作用。讨论了核心问题，包括Ignorability和Consistency假设，以及如何通过这些假设将因果效应转化为可估计的统计量。此外，还介绍了CATE（条件平均因果效应）的估计，涉及到Conditional Ignorability和Positivity假设，并通过一个关于钠摄入与高血压影响的实例展示了从identification到estimation的过程。文章最后指出，考虑到异质性在因果模型中的重要性，以及如何通过更高级的分析方法提高模型准确性。

因果推断区别于传统的相关性研究很重要的一点是潜在结果框架, 也就是我们今天的topic所要涵盖的内容。今天的session我们将会cover以下几个话题：

什么是潜在结果

因果推断的核心问题

对于核心问题的讨论和答案

完整的实例

一、潜在结果

研究treatment对于结果的影响，我们想要同时知道同等条件下，不同treatment下的结果，从而能够得出结论，treatment的改变是否会导致结果的不同

例如
a) 吃药不吃药对于头痛个体(吃药前头痛)的影响

不吃药头痛，吃药之后不头痛：有因果效应
不吃药不头痛，吃药后不头痛：没有因果效应

在这里插入图片描述

1.1 符号说明

我们先约定一下此次课程中所提到的符号，借助这些符号，把上面的因果效应的讨论抽象成数学公式。

随机变量 $X$ 表示 $d$ 维的协变量(covariate)

$T$ 表示干预(treatment)
$Y$ 表示观测到的结果(observed outcome)，我们今天讨论的是二元treatment，也就是 $T = 0$ 或者 $T = 1$

$i$ 表示第 $i$ 个样本(sample/unit/individual)

$Y_i(T)$ 表示对于样本 $i$ 来说接受treatment T之后的潜在结果(potential outcome)，比如 $Y_i(1), Y_i(0)$

$Y_i(1)-Y_i(0)$ 表示因果效应

在这里插入图片描述

1.2 因果推断的核心问题

对于潜在结果， ${Y_i(1), Y_i(0)\}$ 中只会有一个被观测到，因果效应ground truth缺失。实际观测到的结果，只可能是潜在结果中唯一的一个，被称为factual outcome，另一个观测不到的被称为counterfactual。例如前面的例子中提到的对于一个头痛个体，treatment只能二选一，而不能同时给予两个treatment，

      i.   吃药，factual是吃药的结果

      ii.  不吃药，factual是不吃药带来的结果

再举个例子🌰：

滴滴向用户随机发送推荐短信(干预)，用户要么收到短信，要么收不到，这时候用户的反应，只能是其中一种情形下的结果，而不可能是两个结果。对于此短信的反应的实际结果只能依赖于二选一的干预，而不能看到干预和不干预下的用户分别的反应。
在这里插入图片描述

基于潜在结果模型，我们感兴趣的是平均因果效应(Average treatment effect，简记为ATE)

$A T E : E [Y (1) - Y (0)] = E [Y (1)] -$

最低0.47元/天解锁文章

5 条评论

旺仔的算法coding笔记 2022.09.13
请教下同学您，两个问题： 1） CATE 里 “ 引入conditional ignorability或者conditional exchangability的原因在于，unconfoundedness是没有办法实际中验证的，因为我们不知道是否有未观测到的confounding，而这些很可能会在treatment和outcome之间建立别的通道。” 这里的unconfoundedness 改如何翻译理解？ 2）混淆变量confounding和协变量covariate的区别是啥？
- 旺仔的算法coding笔记回复豆沙空空如也 2023.03.27
  谢谢
- 豆沙空空如也回复旺仔的算法coding笔记 2023.02.08
  unconfoundeness 就是无混淆变量，混淆变量是同时影响T和Y的变量，协变量我理解就是模型加入的所有的解释变量。

寒雪吹雪寒 2021.09.06
博主有个问题，有关Ignorability假设，没看懂。为什么T和Y（0），Y（1）独立后就能画等号呢？
- 豆沙空空如也回复寒雪吹雪寒 2023.02.09
  ignorability实际上就类似随机试验，Treatment随机施加，与个体无关。如果现在有两组样本，一个是控制组，一个是实验组，因为我是随机选择某个组作为实验组的，那么我可以认为如果原来的处置组改为控制组，则他们会和原来的控制组有一样的结果，反之亦然。这里E(Y(1)|T=0))的含义就是T=0的组（控制组）在有干预情况下（变为处置组）的值，显然会和原理T=1的组一样。