Introduction to Causal Inference中文笔记part1

原创已于 2025-08-18 03:14:12 修改 · 330 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#笔记 #因果推断

于 2025-05-21 08:28:54 首次发布

因果推断专栏收录该内容

7 篇文章

订阅专栏

参考：
[1]https://www.zhihu.com/people/guo-si-xu-44/posts
[2]因果推断入门：为什么需要因果推断？

1.前4章内容

1.1.相关不等于因果

https://zhuanlan.zhihu.com/p/616903863，细节参考知乎原文。
当有 confounding association（混杂关联）存在的时候，相关不等于因果。比如，C 是喝酒，T 是是否穿鞋睡觉，Y 是头痛，喝酒的人通常穿鞋睡觉，喝酒可以引起头痛，那么 C 就是 confounding variable。
在这里插入图片描述
用数学语言表达就是：

但是如果我们能够将样本进行随机对照实验，也就是说，一个样本是否施加干预完全是随机决定的（decided by flip a coin) 那么我们就可以消除 confounding association，因此随机对照实验可以做到以下两点。
（1）T不会有父节点
（2）对照组和实验组是可以比较的；
在这里插入图片描述

1.2.Potential Outcome

https://zhuanlan.zhihu.com/p/616911774，细节参考知乎原文。

1.2.1.Potential Outcome 定义

intuition：一个政策或者干预产生的效果
在这里插入图片描述

1.2.2.因果推断中的fundmental problem

最大的基础问题就是没有反事实结果。

1.2.3.基本概念

(1)平均因果效应ATE

既然没有个体的反事实，我们可以借助群体，得到平均的因果效应（ATE)，如下图，展示了如何基于数据集得到平均因果效应。但是这个其实是不正确的，因为在这里插入图片描述
（ATE 不等于 association difference） , 在上文中我们已经解释了，为什么这个等式在绝大多数情况下不成立（相关不等于因果）。

(2)假设：Ignorability / Exchangeability

原来他们都是一个意思，只不过从不同的维度描述了一下。Ignorability表示无视掉X 与 T 之间的边。也就是，无视掉样本被分配到对照组或者实验组的机制。在第一节的 covid 的例子中，症状的轻重是决定样本接受 treatmentA 还是 treatmentB 的机制，因此也成为了混杂变量。这个假设是说，当我们无视掉症状的轻重会决定样本被分配何种 treatment 时，下面的等式就成立。
E[Y(1)] - E[Y(0)] = E[Y|T=1] - E[Y|T=0]
在这里插入图片描述
在因果推断中，"exchangeability"假设是指在观测数据中，每个个体的潜在因果效应相互独立，并且潜在因果效应不依赖于该个体的特征或其他因素。这意味着，任何两个个体之间的潜在因果效应应该是等价的，可以互相交换。