构建公平且稳健的因果模型:客户信用政策分析
1. 因果模型组件理解
因果模型主要由四个部分构成,每个部分在模型中都有独特的作用,具体如下:
| 组件 | 含义 |
| ---- | ---- |
| 结果(Y) | 因果模型的结果变量 |
| 处理(T) | 影响结果的处理变量 |
| 效应修饰因子(X) | 影响效应异质性的变量,处于处理和结果之间 |
| 控制变量(W) | 也称为共同原因或混杂因素,影响结果和处理的特征 |
在代码实现中,我们可以将这些组件从数据中识别出来,作为单独的 Pandas 数据框:
W = ccdefault_causal_df[['_spend', '_tpm', '_ppm', '_RETAIL', '_URBAN', '_RURAL', '_PREMIUM']]
X = ccdefault_causal_df[['_CC_LIMIT']]
T = ccdefault_causal_df[['_TREATMENT']]
Y = ccdefault_causal_df[['_LTV']]
2. 双稳健学习方法
为了估计处理效应,我们采用双稳健学习(DRL)方法。之所以称为“双稳健”,是因为它利用了两个模型:
- 用回归模型预测结果。
- 用倾向得分模型预测处理。
最终阶段将两个模型结合,同时保持许多理想的统计特性,如置信区间和渐近正态性。我们使用线性变体(LinearDRLearner),它能返回易于解释的系数和截距。以下是初
超级会员免费看
订阅专栏 解锁全文
42

被折叠的 条评论
为什么被折叠?



