Introduction to Causal Inference中文笔记part1

参考:
[1]https://www.zhihu.com/people/guo-si-xu-44/posts
[2]因果推断入门:为什么需要因果推断?

1.前4章内容

1.1.相关不等于因果

https://zhuanlan.zhihu.com/p/616903863,细节参考知乎原文。
当有 confounding association(混杂关联)存在的时候,相关不等于因果。比如,C 是喝酒,T 是是否穿鞋睡觉,Y 是头痛,喝酒的人通常穿鞋睡觉,喝酒可以引起头痛,那么 C 就是 confounding variable。
在这里插入图片描述
用数学语言表达就是:
在这里插入图片描述
但是如果我们能够将样本进行随机对照实验,也就是说,一个样本是否施加干预完全是随机决定的(decided by flip a coin) 那么我们就可以消除 confounding association,因此随机对照实验可以做到以下两点。
(1)T不会有父节点
(2)对照组和实验组是可以比较的;
在这里插入图片描述

1.2.Potential Outcome

https://zhuanlan.zhihu.com/p/616911774,细节参考知乎原文。

1.2.1.Potential Outcome 定义

intuition:一个政策或者干预产生的效果
在这里插入图片描述

1.2.2.因果推断中的fundmental problem

最大的基础问题就是没有反事实结果。

1.2.3.基本概念

(1)平均因果效应ATE

既然没有个体的反事实,我们可以借助群体,得到平均的因果效应(ATE),如下图,展示了如何基于数据集得到平均因果效应。但是这个其实是不正确的,因为 在这里插入图片描述
(ATE 不等于 association difference) , 在上文中我们已经解释了,为什么这个等式在绝大多数情况下不成立(相关不等于因果)。

(2)假设:Ignorability / Exchangeability

原来他们都是一个意思,只不过从不同的维度描述了一下。Ignorability表示无视掉X 与 T 之间的边。也就是,无视掉样本被分配到对照组或者实验组的机制。在第一节的 covid 的例子中,症状的轻重是决定样本接受 treatmentA 还是 treatmentB 的机制,因此也成为了混杂变量。这个假设是说,当我们无视掉症状的轻重会决定样本被分配何种 treatment 时,下面的等式就成立。
E[Y(1)] - E[Y(0)] = E[Y|T=1] - E[Y|T=0]
在这里插入图片描述
在因果推断中,"exchangeability"假设是指在观测数据中,每个个体的潜在因果效应相互独立,并且潜在因果效应不依赖于该个体的特征或其他因素。这意味着,任何两个个体之间的潜在因果效应应该是等价的,可以互相交换。

在这里插入图片描述

1.3.Graphical Models

https://zhuanlan.zhihu.com/p/618407198,细节参考知乎原文。

2.问题解释

2.1.为什么在因果推断中该公式不成立E[Y(1)] - E[Y(0)] = E[Y|T=1] - E[Y|T=0] ?

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

3.基础知识补充

期望与方差的主要性质

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值