一、风控数据
风控数据分为四部分,资质数据、信贷数据、消费数据、行为数据。其与逾期率的相关性从前往后逐渐减弱。
1)资质类数据包括该个体是否有房车、教育程度、工资水平等个人属性相关的数据;
2)信贷类数据包括历史的借贷额度、借贷次数、还款情况、是否逾期等借贷相关的数据;
3)消费数据包括在电商平台的消费记录等流水相关的数据;
4)行为数据包括个体之间的联系、手机 App 的使用列表、手机型号、浏览内容类别等个人行为数据。
互联网金融中资质较差的客群基本没有资质数据以及合规的信贷数据,虽然有一定的消费数据但是该类数据大多掌握在巨头电商平台手中,所以所能获取到的就是开放度高的互联网行为类数据。行为类数据的优势为覆盖广、成本低,缺陷为相关性弱、变化快。
二、效果评估:KS表是与业务沟通效果最好的方式
业务目标是帮助业务达到预期,如模型上线后,坏账率降低多少,通过率提升多少。而模型目标一般用KS来衡量,或者更关注预测概率前10%人群的坏账率,根据不同目标去设计评价函数,此外也关注模型在未来很长时间内的的稳定性,用PSI来衡量。这里想说的是光看KS数值是不够的,还需要分析KS表,这是与业务沟通效果最好的方式,下面介绍下KS表主要的组成及badcase: