Identification
Introduction
在介绍这节的补充内容呢,我想先引进一个著名的**“辛普森悖论”**。
辛普森医生发现了一种新药,这种新药可以降低心脏病发作的风险,于是他开始查找历史的实验数据。他注意到,如果男性患者服用了这种药,心脏病发作的风险反而高了。然后他再转向女性患者,结果大吃一惊:女性患者复用这种药以后心脏病发作的风险也变高了。但是这种药从数据上来说对整个人群来说是有益的。为什么对女性、男性有害,但是对人类有益?
以数据表明这种现象如下。
| 服药组 | 未服药组 | |
|---|---|---|
| 男性(357700=0.51)\frac {357}{700}=0.51)700357=0.51)) | 8187=0.93\frac {81}{87}=0.938781=0.93 | 234270=0.87\frac {234}{270}=0.87270234=0.87 |
| 女性(363700=0.49\frac {363}{700}=0.49700363=0.49) | 192263=0.73\frac {192}{263}=0.73263192=0.73 | 5580=0.69\frac {55}{80}=0.698055=0.69 |
| 总数 | 273350=0.78\frac {273}{350}=0.78350273=0.78 | 289350=0.83\frac {289}{350}=0.83350289=0.83 |
其中反映了男性和女性服药与不服药的比例是不同的,男性服药的人数远远小于不服药的人数,而女性服药的人数远远大于不服药的人数,因此性别是复用药物和心脏病发作的一个cofunder。辛普森悖论不过是非常简单的数学现象。如果A/B > a/bA/B \: > \: a/bA/B>a/b and C/D > c/dC/D \: > \:c/dC/D>c/d, 那么从中不能推出(A+C)/(B+D) > (a+b)/(c+d)(A +C)/(B+D) \: > \: (a+b)/(c+d)(A+C)/(B+D)>(a+b)/(c+d)
Identification under Graphical Constraints
使用do−caculusdo-caculusdo−caculus我们可以在许多情况下推导出简单的因果识别方法。在本 节中介绍两种方法一个是(1)调整公式,(2)前门路径法则 。
Adjustment Formula
举个例子,让我们考虑一个简单的因果概率分布P(B∣do(A))P(B|do(A))P(B∣do(A))在某个因果图GGG中。在这里,我们将展示对这一因果目标的两种简单操作如何为我们提供一种有用的识别方法,称为调整公式:

本文探讨了著名的辛普森悖论,通过一个药物治疗心脏病的例子展示了该悖论如何在不同群体中产生矛盾的结果。接着,介绍了在因果推断中使用的调整公式和前门路径法则,解释了如何在存在混杂因素的情况下识别因果效应。文章详细阐述了调整公式的步骤,并利用图形表示因果关系,强调了在某些情况下工具变量的重要性。
最低0.47元/天 解锁文章
1735

被折叠的 条评论
为什么被折叠?



