因果推断(二)——混杂因子,D-分离,后门准则

本文深入探讨了因果推断中的关键概念——混杂因子、D-分离和后门准则。通过诺贝尔奖、巧克力和教育水平的例子,解释了混杂因子如何造成伪相关,并利用D-分离原则分析了如何在不同结构中判断变量的条件独立性。后门准则则提供了一种消除伪相关,揭示真正因果关系的方法。对于因果关系的正确分析,理解和应用这些原理至关重要。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

上次已经和大家分享了因果推断中的贝叶斯相关知识,今天这部分和大家分享因果推断中的混杂因子,D-分离,后门准则的相关内容。

图片先上例子

以上一篇中的诺贝尔奖和巧克力的事件为例,下图是他们三者的因果图,从图中可以看出这是一个叉式结构,即A和C相关。但是他们的相关性是通过“经济,教育水平”关联的,他们之间是伪相关,而B就是混杂因子,是它造成了A和C之间的伪相关。从字面上也很好理解,是因为B的存在导致我们对A和C之间的因果关系产生了混乱。

下图这种形式B也是confunder,即混杂因子。这种情况下,我们想要去发掘A和C的因果关系时,需要去除混杂因子,因为A->C的因果关系和A<-B->C造成的伪相关混合在一起了。

为了能正确分析因果关系,我们需要消除混杂,伪相关。

图片

### 因果推断中的前门准则与后门准则 #### 后门准则概念 在因果图模型中,后门路径是指那些能够使处理变量X和结果变量Y之间的关联变得混淆的间接路径。为了消除这种混淆因素的影响,需要阻塞所有的后门路径。具体来说,如果一组变量Z满足以下条件,则认为这组变量可以用来控制后门路径: - Z包含了所有指向X的箭头起点节点; - 对于任何碰撞节点W(即形如A→W←B),要么不在Z内,要么其后代也不在Z内。 通过调整这些变量,可以在观察数据上实现如同随机对照试验的效果,从而得到无偏倚的因果效应估计[^4]。 #### 前门准则概念 当无法直接测量某些混杂因子时,可以通过寻找中介变量来构建所谓的“前门”。所谓前门标准指的是,在给定条件下,某个特定集合M满足如下三个性质即可视为有效的前门调节器: - M完全介导了从X到Y的所有直接影响; - 不含来自U对M的未受控入边; - 所有的后门通路都被适当封闭。 利用这样的中间机制,即便存在未知或不可测得的因素干扰原始因果链,仍然有可能评估出真实的因果关系强度。 #### 应用实例 考虑药物治疗效果的研究场景下,假设我们想要探究某种新药对于患者康复速度的具体影响。此时可能会遇到各种潜在的混杂因素,比如患者的年龄、性别差异或是其他健康状况等。按照上述原则选取合适的协变量集合作为后门控制器;而如果是探讨广告投放对企业销售额增长的作用力大小,则可借助销售量变化趋势作为前门媒介来进行分析[^2]。 ```python import numpy as np from sklearn.linear_model import LinearRegression def estimate_causal_effect(X, Y, confounders=None): """ Estimate causal effect using linear regression with or without controlling for confounders. Parameters: X (array-like): Treatment variable. Y (array-like): Outcome variable. confounders (array-like, optional): Confounding variables to control for. Returns: float: Estimated average treatment effect on the treated. """ model = LinearRegression() if confounders is not None: features = np.column_stack((X, confounders)) else: features = X.reshape(-1, 1) model.fit(features, Y) ate = model.coef_[0] return ate ```
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值