@[因果推断与机器学习](Why you might Care )
Simpson’s Paradox
考虑一个纯粹假设的未来,那里有一种被称为COVID-27的新疾病在人类中普遍存在。在这个纯粹假设的未来中,已经开发了两种治疗方法: 治疗A和治疗B。治疗B比治疗A价格更贵,因此当前接受治疗A与治疗B的那些人的划分大致为73%/27%。在一个只关心尽量减少生命损失的国家,你负责选择你的国家将专门使用哪种治疗方法。
你有死于 COVID-27 的人的百分比数据,考虑到他们被分配的治疗,以及他们在决定治疗时的状况。他们的病情是一个二元变量:轻度或重度。在该数据中,接受 A 的人中有 16% 死亡,而接受 B 的人中有 19% 死亡。但是,当我们将病情较轻的人与病情严重的人分开检查时,数字的顺序相反。在轻度亚群中,接受 A 的人中有 15% 死亡,而接受 B 的人中有 10% 死亡。在重症亚群中,接受 A 的人中有 30% 死亡,而接受 B 的人中有 20% 死亡。我们在表 1.1 中描述了这些百分比和相应的计数。
| Treatment | Mild | Severe | Total |
|---|---|---|---|
| A | 15% (210/1400) |
30% (30/100) |
16% (2240/1500) |
| B | 10% (5/50) |
20% (100/500) |
19% (105/550) |
表1.1: COVID-27数据中的辛普森悖论百分比表示每组的死亡率。越低越好。括号中的数字是相应的计数。这种明显的悖论源于这样的解释,即在检查整个人群
辛普森悖论解析

最低0.47元/天 解锁文章
7564

被折叠的 条评论
为什么被折叠?



