无参数贝叶斯决策树在提升建模中的应用
1. 引言
提升建模旨在评估诸如营销活动或药物等干预措施对个体行为的增量影响,在个性化医疗和广告等领域有重要应用。然而,由于数据部分已知,即无法观察个体对其他替代干预措施的反应,使得提升建模成为一项具有挑战性的任务。目前的提升决策树方法存在局部分裂标准等局限性,为此提出了无参数的提升贝叶斯决策树(UB - DT)和提升贝叶斯随机森林(UB - RF)方法。
2. 背景与相关工作
2.1 提升问题的定义
提升的概念由Radcliffe和Surry引入,并在Rubin的因果推理模型中被定义为个体治疗效果(ITE)。假设有N个个体的群体X,每个个体由一组变量K描述,用Z表示个体是否接受干预,Y表示结果变量。个体i的提升τi定义为:τi = Yi(Z = 1) - Yi(Z = 0)。但实际中无法同时观察到Yi(Z = 1)和Yi(Z = 0),因此通过条件平均治疗效果(CATE)来估计提升:
CATE : ˆτi = E[Yi(Z = 1)|Xi] - E[Yi(Z = 0)|Xi]
2.2 相关工作
提升建模方法主要分为两类:
- 元学习器 :利用常见的机器学习算法来估计CATE。例如两模型方法,分别为治疗组和对照组拟合独立的分类模型,估计的提升为两个模型估计值的差值,但该方法在某些特定模式下存在弱点。因果推理社区还提出了X - 学习器、R - 学习器和DR - 学习器等。
- 定制方法 :如基于树的算法。[15]定义了一种分裂标准,使用加权散度度量(如Kullback -
超级会员免费看
订阅专栏 解锁全文
2006

被折叠的 条评论
为什么被折叠?



