【因果推断与机器学习】Causal Inference: Chapter_3

本文探讨了著名的辛普森悖论,通过一个药物治疗心脏病的例子展示了该悖论如何在不同群体中产生矛盾的结果。接着,介绍了在因果推断中使用的调整公式和前门路径法则,解释了如何在存在混杂因素的情况下识别因果效应。文章详细阐述了调整公式的步骤,并利用图形表示因果关系,强调了在某些情况下工具变量的重要性。

Identification

Introduction

在介绍这节的补充内容呢,我想先引进一个著名的**“辛普森悖论”**。
辛普森医生发现了一种新药,这种新药可以降低心脏病发作的风险,于是他开始查找历史的实验数据。他注意到,如果男性患者服用了这种药,心脏病发作的风险反而高了。然后他再转向女性患者,结果大吃一惊:女性患者复用这种药以后心脏病发作的风险也变高了。但是这种药从数据上来说对整个人群来说是有益的。为什么对女性、男性有害,但是对人类有益?
以数据表明这种现象如下。

服药组 未服药组
男性(357700=0.51)\frac {357}{700}=0.51)700357=0.51) 8187=0.93\frac {81}{87}=0.938781=0.93 234270=0.87\frac {234}{270}=0.87270234=0.87
女性(363700=0.49\frac {363}{700}=0.49700363=0.49) 192263=0.73\frac {192}{263}=0.73263192=0.73 5580=0.69\frac {55}{80}=0.698055=0.69
总数 273350=0.78\frac {273}{350}=0.78350273=0.78 289350=0.83\frac {289}{350}=0.83350289=0.83

其中反映了男性和女性服药与不服药的比例是不同的,男性服药的人数远远小于不服药的人数,而女性服药的人数远远大于不服药的人数,因此性别是复用药物和心脏病发作的一个cofunder。辛普森悖论不过是非常简单的数学现象。如果A/B > a/bA/B \: > \: a/bA/B>a/b and C/D > c/dC/D \: > \:c/dC/D>c/d, 那么从中不能推出(A+C)/(B+D) > (a+b)/(c+d)(A +C)/(B+D) \: > \: (a+b)/(c+d)(A+C)/(B+D)>(a+b)/(c+d)

Identification under Graphical Constraints

使用do−caculusdo-caculusdocaculus我们可以在许多情况下推导出简单的因果识别方法。在本 节中介绍两种方法一个是(1)调整公式,(2)前门路径法则 。

Adjustment Formula

举个例子,让我们考虑一个简单的因果概率分布P(B∣do(A))P(B|do(A))P(Bdo(A))在某个因果图GGG中。在这里,我们将展示对这一因果目标的两种简单操作如何为我们提供一种有用的识别方法,称为调整公式:

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值