双重机器学习(DML):原理、实践与对比
1. 双重机器学习(DML)概述
双重机器学习(DML)是一种强大的因果推断方法,它具有低方差和低偏差的特点,能够为我们提供有效的置信区间,并且天然支持离散和连续处理变量。在DML中,除了拟合用于预测结果和处理变量的模型外,还会拟合一个最终模型来从残差中估计因果参数 $\theta$。在线性DML中,这个最终模型是线性回归;而在广义的非参数DML中,可以使用任意的机器学习回归器。
2. 使用DoWhy和EconML实现线性DML
我们可以使用DoWhy和EconML库来实现线性DML估计器,并将其应用于数据。以下是具体的实现步骤:
1. 跳过图创建、模型初始化和估计量识别步骤 :因为这些步骤与之前的模型实现相同。DoWhy提供的模块化逻辑使得不同方法的实验变得无缝,因为问题定义和估计量识别与估计步骤完全独立。
2. 使用线性DML :需要将 'backdoor.econml.dml.LinearDML' 传递给 method_name 参数。同时,引入额外的参数 'discrete_treatment' 并将其设置为 True ,因为EconML的DML估计器默认处理连续处理变量,而我们的处理变量是二元的。
以下是实现代码:
estimate = model.estimate_effect(
identified_
超级会员免费看
订阅专栏 解锁全文
2万+

被折叠的 条评论
为什么被折叠?



