因果森林与实验数据中的异质处理效应分析
1. 因果森林概述
因果森林(Causal Forest)是一种基于树的模型,源于Susan Athey、Julie Tibshirani和Stefan Wager的研究。它与普通随机森林的核心区别在于使用了因果树。普通随机森林和因果森林在方法上有相似之处,都采用重采样、预测子集选择和多棵树的平均。
1.1 因果树
因果树与普通树的不同之处在于分割标准。因果树使用基于估计处理效应的标准,采用所谓的“诚实分割”,即在训练数据上生成分割,而叶节点值使用保留集进行估计,这与双机器学习(DML)中的交叉拟合逻辑非常相似。
1.2 EconML中的因果森林实现
在大多数情况下,dml模块中的CausalForestDML类可能是使用因果森林的最佳起点。EconML还在grf模块中提供了原始版本的因果森林CausalForest,但该类不估计干扰参数,可能会导致与CausalForestDML相比不太理想的结果。
1.3 因果森林的优势
因果森林模型在处理高维数据时是一个不错的选择。它们是非参数的,提供有效的置信区间,并且具有很高的灵活性。
1.4 使用DoWhy和EconML的因果森林
要使用具有DML正交化的因果森林,只需将方法名称传递给method_name参数。还可以自行选择结果和处理模型,具体操作与DML估计器相同。如果处理是离散的,不要忘记在init_params字典中包含’discrete_treatment’: True。以下是一个代码示例:
超级会员免费看
订阅专栏 解锁全文
1784

被折叠的 条评论
为什么被折叠?



