参考:
[1]https://www.zhihu.com/people/guo-si-xu-44/posts
[2]因果推断入门:为什么需要因果推断?
1.前4章内容
1.1.相关不等于因果
https://zhuanlan.zhihu.com/p/616903863,细节参考知乎原文。
当有 confounding association(混杂关联)存在的时候,相关不等于因果。比如,C 是喝酒,T 是是否穿鞋睡觉,Y 是头痛,喝酒的人通常穿鞋睡觉,喝酒可以引起头痛,那么 C 就是 confounding variable。

用数学语言表达就是:

但是如果我们能够将样本进行随机对照实验,也就是说,一个样本是否施加干预完全是随机决定的(decided by flip a coin) 那么我们就可以消除 confounding association,因此随机对照实验可以做到以下两点。
(1)T不会有父节点
(2)对照组和实验组是可以比较的;

1.2.Potential Outcome
https://zhuanlan.zhihu.com/p/616911774,细节参考知乎原文。
1.2.1.Potential Outcome 定义
intuition:一个政策或者干预产生的效果

1.2.2.因果推断中的fundmental problem
最大的基础问题就是没有反事实结果。
1.2.3.基本概念
(1)平均因果效应ATE
既然没有个体的反事实,我们可以借助群体,得到平均的因果效应(ATE),如下图,展示了如何基于数据集得到平均因果效应。但是这个其实是不正确的,因为 
(ATE 不等于 association difference) , 在上文中我们已经解释了,为什么这个等式在绝大多数情况下不成立(相关不等于因果)。
(2)假设:Ignorability / Exchangeability
原来他们都是一个意思,只不过从不同的维度描述了一下。Ignorability表示无视掉X 与 T 之间的边。也就是,无视掉样本被分配到对照组或者实验组的机制。在第一节的 covid 的例子中,症状的轻重是决定样本接受 treatmentA 还是 treatmentB 的机制,因此也成为了混杂变量。这个假设是说,当我们无视掉症状的轻重会决定样本被分配何种 treatment 时,下面的等式就成立。
E[Y(1)] - E[Y(0)] = E[Y|T=1] - E[Y|T=0]

在因果推断中,"exchangeability"假设是指在观测数据中,每个个体的潜在因果效应相互独立,并且潜在因果效应不依赖于该个体的特征或其他因素。这意味着,任何两个个体之间的潜在因果效应应该是等价的,可以互相交换。

1.3.Graphical Models
https://zhuanlan.zhihu.com/p/618407198,细节参考知乎原文。
2.问题解释
2.1.为什么在因果推断中该公式不成立E[Y(1)] - E[Y(0)] = E[Y|T=1] - E[Y|T=0] ?





被折叠的 条评论
为什么被折叠?



