下图是一个模型demo。
低分段的区分能力较好。有两个原因,第一,低分段的客户确实很多,sample_cnt有1059个,占了所有用户的20.98%。
但是哪怕去掉最后一档,类似坏账率还是达到了50.6%,而且这是以7天作为表现期的标签。
真实的逾期触发是51%左右,哪怕去掉最后2挡,7天内的还款也只有5%左右。
从坏账率来看,排序性是还可以的。但是看odds,最高分段的只有5.06,就是说好坏比是5比1.第二高分段只剩下2.9了,所以这个模型表现在中分段的表现实很差的。由于线上的表现是随机的(量小导致),所以可能会导致线上的排序性不好,因为odds本身没有已经没有很多的区分能力了。
可以看出来2个问题,第一,用户客群本身就是很差的,不然不可能会出现最低分段拥堵的情况。第二,特征的区分能力不强,这有两个原因,1是特征本身不强,2是客群很会演。
如果直接以硬规则拒贷的话,通过率就会很低。
贴一个demo的ks图