目录:
因果森林
广义随机森林
正交森林
因果树/因果森林:
异质性(Heterogeneity)
-
一个变量X对另一个变量Y的影响可能因个体而异
直接训练普通 CART 树(特征为X, 输出为 T ), 然后套用上式评估CATE。
目标:从协变量中,找到一个最优分裂节点,最大化子节点间处理效应差异。
因果树:使得每个组中都有实验组个体与对照组个体,因此每个分组都构成了一个人为构造的实验,可以直接计算出处理效应
因果森林由多棵因果树构成,由于需要Honest estimation(用互不重合的数据分别进行split和estimate),因此相较于决策树,每棵因果树split的分裂准则修改如下:
此公式引用于《Recursive Partitioning for Heterogeneous Causal Effects》 2015年
另外一篇文章也提到了诚实的方法
将训练样本分成两份
-
训练集Str:一份用来先训练普通 CART 树(特征为 X, 输出为T ),把相似的个体放到一个叶节点

文章探讨了因果森林和广义随机森林在估计异质性因果效应中的方法,包括使用因果树和诚实估计策略。通过CART树和LGBM模型,对数据进行分割和预测,以最大化处理效应的差异,并提供了一个2015年至2017年间方法演进的视角。代码示例展示了如何使用CausalForest和LGBMClassifier进行建模。
最低0.47元/天 解锁文章
1799

被折叠的 条评论
为什么被折叠?



