我们在实际制作信贷风控评分卡模型的时候,往往会使用子模型叠加的方式来操作,这有两个好处:
1.增加模型稳定型。当一个数据源数据损坏的时候,我们可以简单的拿掉这个数据源;
2.及时使用新数据。当一个新数据源上线的时候,可以简单的增加一个新的子模型;
本文我们来讨论一种灵活增加减少子模型的方法。
在子模型基础之上做融合模型的时候一般会使用线性模型来做:
比方说我们有三个子模型,那融合模型就是:
如果这个时候,子模型3的数据坏掉了,我们的总模型就会变成
这样的简单处理方式可以保证融合模型仍然具有剩下两个子模型的区分度,但是分数分布会整体下移,且分布的方差会缩小,使得整体数据稳定性变差。
为了在去掉模型3后分数的分布不发生大的偏移,我们可以把分数融合时的权重做一个调整。
在调整的时候我们要考虑子分分数分布的标准差,这样在做权重调整时不会过多受到子分的波动影响。计算每个子分的标准差,然后融合模型公式改写如下: