因果推断----中介公式

该博客探讨了在变量间无混杂情况下,中介变量M如何影响处理X与结果Y的关系。自然间接效应(NIE)公式展示了X通过M对Y产生的间接影响,揭示了因果路径中的复杂交互作用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

中介公式

假如变量之间没有混杂,M是处理X和结果Y之间的中介物,则自然间接效应为:

NIE = ∑ m [ P ( M = m ∣ X = 1 ) − P ( M = m ∣ X = 0 ) ] × P ( Y = 1 ∣ X = 0 , M = m ) \text{NIE} = \sum_m[P(M=m|X=1) - P(M=m|X=0)] \times P(Y=1|X=0, M=m) NIE=m[P(M=mX=1)P(M=mX=0)]×P(Y=1X=0,M=m)
中括号内的表达式代表XM的影响,乘号后的表达式代表MY的影响(当X=0时)。

### S-Learner 算法原理 S-Learner 是一种用于因果推断的方法,属于单模型方法(Single Model Approach)。这种方法的核心思想是在构建单一预测模型时,将干预变量作为一个额外的输入特征。对于二元干预情况,即存在与否两种状态,可以通过设置干预标志位为1或0来进行区分。 具体来说,在训练阶段,会创建一个统一的数据集,其中包含所有协变量以及指示是否接受过特定处理的一个二进制标签[^5]。这个标签通常被编码成数值形式,比如未处理记作0,已处理则设为1。接着利用这些数据去拟合一个监督学习模型,如线性回归、决策树或是更复杂的神经网络等。 当需要评估某个体在接受不同处理条件下的潜在结果差异时,则只需改变该个体记录中对应于上述提到的二进制标签的位置值即可——将其设定为1代表考虑其处于已被施加某种影响的状态下可能产生的响应;反之亦然,置零意味着考察它在自然状态下应有的表现。最终通过对同一对象在这两种情形之下所获得的结果预估值求差,便能得出所谓的“处理效应”。 #### 数学表达式 给定一组样本 \((X_i,T_i,Y_i)\),\(T\) 表示治疗分配向量 (\(T\in{0,1}\)) ,而 \(Y\) 则是观察到的结果。那么对于任意个体 i 的预期收益可以定义如下: \[ E[Y|X=x,T=t]=f(x,t;\theta), t∈{0,1} \] 这 f() 函数由选定的学习器决定,并且参数 θ 可以通过最小化损失函数 L 来估计: \[ argmin_\theta ∑_{i=1}^{N}[y_i-f(x_i,t_i;θ)]^2 \] 一旦获得了这样的模型之后,就可以计算出每个单位上因受到处理所带来的变化幅度 Δ : \[Δ=E[Y|X=x,T=1]-E[Y|X=x,T=0]\] 这实际上就是在说如果某人经历了某些事情前后会发生怎样的转变程度。 ### 应用场景实例 考虑到实际案例的应用价值,S-Learner 已经广泛应用于多个领域内解决个性化推荐系统设计、市场营销策略制定等问题之中。例如在一个电商平台上想要测试促销活动的效果如何,就可以采用这种方式来衡量顾客群体哪些成员最有可能因为折扣优惠而增加购买频率或者金额大小的变化趋势[^3]。 另一个典型例子来自于医疗健康行业内的精准诊疗方案探索方面。医生们希望能够找到最适合每位病患的独特治疗方法组合,而不是简单依赖通用指南行事。借助于此技术手段能够帮助识别那些真正受益于新型疗法而非传统护理模式的人群特性因素集合。 ```python from sklearn.linear_model import LinearRegression import numpy as np def s_learner(X_train, T_train, Y_train, X_test): """ 使用简单的线性回归实现S-learner. 参数: X_train : array-like of shape (n_samples, n_features) 训练集特征矩阵 T_train : array-like of shape (n_samples,) 处理/对照标记 Y_train : array-like of shape (n_samples,) 结果变量 X_test : array-like of shape (m_samples, n_features) 测试集特征矩阵 返回: ite : ndarray of shape (m_samples,) 对应于每个测试样例的个体处理效果 """ # 合并特征和处理指标作为新的特征空间 combined_X = np.column_stack([X_train, T_train]) # 构造并训练线性回归模型 lr = LinearRegression() lr.fit(combined_X, Y_train) # 获取两个版本的预测值:一个是假设所有人都接受了处理, # 另外则是没有人接受任何处理的情况。 treated_predictions = lr.predict(np.column_stack([X_test, np.ones(len(X_test))])) control_predictions = lr.predict(np.column_stack([X_test, np.zeros(len(X_test))])) # ITE等于两者的差别 ite = treated_predictions - control_predictions return ite # 假设我们已经有了合适的训练数据... ite_estimates = s_learner(X_train, treatment_flag, outcome_variable, new_customers_data) print("Estimated Individual Treatment Effects:", ite_estimates[:10]) ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值