因果推断与机器学习:从匹配到元学习器
在因果推断与机器学习的领域,元学习器是一类强大的工具,可用于估计异质处理效应(HTE,也称为CATE)。本文将介绍三种常见的元学习器:S-Learner、T-Learner和X-Learner,并探讨它们的优缺点及适用场景。
S-Learner
S-Learner是一种相对简单且灵活的模型,它将处理变量视为其他普通变量一样进行处理。以下是关于S-Learner的详细介绍:
- 性能评估 :通过绘制真实效应与预测值的关系图,可以直观地评估S-Learner的性能。在测试集上,整体表现良好,但仍存在部分观测值低估效应的情况。
graph LR
A[真实效应] --> B(绘制关系图)
B --> C[评估S-Learner性能]
- 小数据集影响 :当数据集较小时,S-Learner的性能会显著下降。例如,在仅使用100个观测值进行训练时,平均绝对百分比误差(MAPE)达到35.9%,远高于原始数据集。
| 数据集大小 | MAPE |
| ---- | ---- |
| 原始数据集 | 较低 |
| 100个观测值 | 35.9% | - S-Learner的弱点 :由于S-Learner将处理变量视为普通变量,当处理效应较小时,模型可能会完全忽略处理变量,导致预测的因果效应为零。一种启发式的解决方法是使用更深的树来增加处理变
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



