《智能风控实践指南》笔记(二)

本文探讨了《智能风控实践指南》中模型策略的交换集分析,特别是拒绝推断。交换集分析通过比较新旧模型对客户的接受与拒绝,评估模型策略效果。换入客群即新模型通过而旧模型拒绝的部分,其坏账率需要通过拒绝推断预估。文中提到了利用新模型在有表现样本上的坏账率来估算旧模型拒绝样本的坏账率,并讨论了全局测试推断、A/B测试组推断和线性拟合判断三种修正方法。正常情况下,换入客群的坏账率低于换出客群,比例在60%-90%之间。

        本文是对《智能风控实践指南》中模型策略分析方法这一小节中交换集分析(又叫换入换出分析)中的拒绝推断部分展开谈谈。这个方法正好之前一位做模型的朋友详细和我说过,这次在书中看到确实有产生一些共鸣。

       交换集分析,是指利用新旧模型通过和拒绝的客户不一致的情况,通过分析这些不一致客户的坏账率和通过率以评价模型策略的效果。换出是新模型拒绝而旧模型通过的客群,换入是新模型通过而旧模型拒绝的客群。通常,我们希望新模型能换出更多的不良用户,换入更多的好客户,从而用好客户代替不良客户,以降低整体坏账率。

       换入客群是新模型通过而旧模型拒绝的客群,这部分是之前被拒绝的客户,其好坏标签未知,需要采用拒绝推断的方式进行预估。其实不止模型策略分析时会采用换入换出分析,在做策略替换的时候也会用到。这里的拒绝推断不等同于模型部分的拒绝推断。因为模型部分的拒绝推断,是对模型拒绝的样本作推断,而这里是需要对旧模型拒绝、新模型通过的样本作推断,是从拒绝的客户中再挑一部分出来推断。

        书中介绍的一种方法,是利用新模型各分数段在有表现样本上的坏账率来估算旧模型拒绝样本上的坏账率。

       如上图,左侧是新模型在有表现样本上的坏账率排序,右边是旧模型拒绝的样本,用新模型打分之后的分布情况。黄色线以下B-C就是旧模型拒绝、新模型通过的样本,也就是要估算这部分客群的坏账。这里假设新旧模型在同分数段的坏账率是一样的,因此估出来的坏账就是:

(20*8.63%+10*9.44%+10*8.33%+...)/(20+10+10+...)=8.04%

        这里的前提假设很重要,实际上新模型的效力应该比旧模型好,也就是同分端下通过部分的坏账率会更低。所以上面以新模型通过部分的坏账率来对老模型的拒绝样本做评估时,实际上存在了低估拒绝样本的坏账情况。实际业务中还需要对上面的结果做修正,比如按1.1、1.2的倍数去拍,再结合测试数据来修正。

        如何修正,书里介绍了三种方法。主要的一个方法还是旧模型决策时留出一小部分测试样本不作拒绝,以大致预估这部分客群的坏账率。

1、全局测试推断

      为了持续验证风控策略的有效性,有时会设置0.5%-1%的流量空跑策略,命中策略标签但是不拒绝。所以会有一小部分换入客群的表现,可以得到坏账率。

2、A/B测试组推断

       若旧模型上线初期采用了A/B测试,会有一部分客户只打分不拒绝,也可以用来作为拒绝客户坏账率的预估值。本人理解,一和二其实是同一种方法,由于只有一小部分样本,因此估计会有偏,可以作为参考值。

3、线性拟合判断

       适用于没有一、二的情况。一二这种情况,需要从漏放的样本再挑出新模型通过的样本。而第三种方法更像是模型决策时的拒绝推断,只能推断出拒绝样本的坏账,而无法再进一步对旧模型拒绝、新模型通过的样本进行推断。

       以分箱序号作横轴,逾期率为纵轴,绘制坏账率拟合曲线。上图中第8、9箱旧模型拒绝的客户,而换入客群是新模型从这些里面挑出较好的客群,因此应该是对第8箱且靠近第7箱的这部分客群进行预估(前提是旧模型对拒绝客户仍有一定排序性)。

       正常情况下,换入客群的坏账率要低于换出客群,根据经验前者一般是后者的60%-90%,会由于实际业务和模型效果的不同而略有差异。

【作者】:Labryant  
【原创公众号】:风控猎人  
【简介】:做一个有规划的长期主义者。
【转载说明】:转载请说明出处,谢谢合作!~

拍贷“魔镜风控系统”从平均 拍贷“魔镜风控系统”从平均 拍贷“魔镜风控系统”从平均 拍贷“魔镜风控系统”从平均 拍贷“魔镜风控系统”从平均 拍贷“魔镜风控系统”从平均 拍贷“魔镜风控系统”从平均 拍贷“魔镜风控系统”从平均 400 个数据维度评估用户当前的信状态,给每借款 个数据维度评估用户当前的信状态,给每借款 个数据维度评估用户当前的信状态,给每借款 个数据维度评估用户当前的信状态,给每借款 个数据维度评估用户当前的信状态,给每借款 个数据维度评估用户当前的信状态,给每借款 个数据维度评估用户当前的信状态,给每借款 个数据维度评估用户当前的信状态,给每借款 个数据维度评估用户当前的信状态,给每借款 个数据维度评估用户当前的信状态,给每借款 人打出当前状态的 信用分,在此基础上再结合新发标息对于每个人打出当前状态的 信用分,在此基础上再结合新发标息对于每个人打出当前状态的 信用分,在此基础上再结合新发标息对于每个人打出当前状态的 信用分,在此基础上再结合新发标息对于每个人打出当前状态的 信用分,在此基础上再结合新发标息对于每个人打出当前状态的 信用分,在此基础上再结合新发标息对于每个人打出当前状态的 信用分,在此基础上再结合新发标息对于每个人打出当前 状态的 信用分,在此基础上再结合新发标息对于每个人打出当前状态的 信用分,在此基础上再结合新发标息对于每个人打出当前状态的 信用分,在此基础上再结合新发标息对于每个人打出当前状态的 信用分,在此基础上再结合新发标息对于每个人打出当前状态的 信用分,在此基础上再结合新发标息对于每个人打出当前状态的 信用分,在此基础上再结合新发标息对于每个人打出当前状态的 信用分,在此基础上再结合新发标息对于每个人打出当前状态的 信用分,在此基础上再结合新发标息对于每个人打出当前状态的 信用分,在此基础上再结合新发标息对于每个人打出当前状态的 信用分,在此基础上再结合新发标息对于每个6个月内逾 个月内逾 期率的预测 ,为投资人提供关键决策依据。本次竞赛目标是根用户历史行数来期率的预测 ,为投资人提供关键决策依据。本次竞赛目标是根用户历史行数来期率的预测 ,为投资人提供关键决策依据。本次竞赛目标是根用户历史行数来期率的预测 ,为投资人提供关键决策依据。本次竞赛目标是根用户历史行数来期率的预测 ,为投资人提供关键决策依据。本次竞赛目标是根用户历史行数来期率的预测 ,为投资人提供关键决策依据。本次竞赛目标是根用户历史行数来期率的预测 ,为投资人提供关键决策依据。本次竞赛目标是根用户历史行数来期率的预测 ,为投资人提供关键决策依据。本次竞赛目标是根用户历史行数来期率的预测 ,为投资人提供关键决策依据。本次竞赛目标是根用户历史行数来期率的预测 ,为投资人提供关键决策依据。本次竞赛目标是根用户历史行数来期率的预测 ,为投资人提供关键决策依据。本次竞赛目标是根用户历史行数来期率的预测 ,为投资人提供关键决策依据。本次竞赛目标是根用户历史行数来期率的预测 ,为投资人提供关键决策依据。本次竞赛目标是根用户历史行数来期率的预测 ,为投资人提供关键决策依据。本次竞赛目标是根用户历史行数来期率的预测 ,为投资人提供关键决策依据。本次竞赛目标是根用户历史行数来期率的预测 ,为投资人提供关键决策依据。本次竞赛目标是根用户历史行数来期率的预测 ,为投资人提供关键决策依据。本次竞赛目标是根用户历史行数来期率的预测 ,为投资人提供关键决策依据。本次竞赛目标是根用户历史行数来期率的预测 ,为投资人提供关键决策依据。本次竞赛目标是根用户历史行数来用户在未来 用户在未来 用户在未来 6个月内是否会逾期还款的概率。 个月内是否会逾期还款的概率。 个月内是否会逾期还款的概率。 个月内是否会逾期还款的概率。 个月内是否会逾期还款的概率。 个月内是否会逾期还款的概率。 个月内是否会逾期还款的概率。 问题转换成 问题转换成 问题转换成 2分类问题,评估指标为 分类问题,评估指标为 分类问题,评估指标为 分类问题,评估指标为 分类问题,评估指标为 分类问题,评估指标为 分类问题,评估指标为 AUC ,从 Master Master Master,LogInfoLogInfo LogInfo ,UpdateInfo UpdateInfo UpdateInfo 表中构建 表中构建 特征,考虑评估指标为 特征,考虑评估指标为 特征,考虑评估指标为 特征,考虑评估指标为 特征,考虑评估指标为 AUC AUC,其本质是排序优化问题,所以我们在模型顶层融合也使用基于 ,其本质是排序优化问题所以我们在模型顶层融合也使用基于 ,其本质是排序优化问题所以我们在模型顶层融合也使用基于 ,其本质是排序优化问题所以我们在模型顶层融合也使用基于 ,其本质是排序优化问题所以我们在模型顶层融合也使用基于 ,其本质是排序优化问题所以我们在模型顶层融合也使用基于 ,其本质是排序优化问题所以我们在模型顶层融合也使用基于 ,其本质是排序优化问题所以我们在模型顶层融合也使用基于 ,其本质是排序优化问题所以我们在模型顶层融合也使用基于 ,其本质是排序优化问题所以我们在模型顶层融合也使用基于 ,其本质是排序优化问题所以我们在模型顶层融合也使用基于 ,其本质是排序优化问题所以我们在模型顶层融合也使用基于 ,其本质是排序优化问题所以我们在模型顶层融合也使用基于 ,其本质是排序优化问题所以我们在模型顶层融合也使用基于 ,其本质是排序优化问题所以我们在模型顶层融合也使用基于 排序优化的 排序优化的 排序优化的 RANK_AVG RANK_AVG RANK_AVG融合方法。 融合方法。 融
1. 营销获客 2. 贷前风控 2.1 贷前审查 2.2 反欺诈 2.3 风控策略 2.4 风控建模 2.5 数据管理 风控总监训练营 ......................................................................................................792 4 节课玩转信用评分卡模型....................................................................................792 如何搭建虚拟信用卡风控体系 ...............................................................................792 风控大牛手把手教你搭建企业级信用评分模型.....................................................792 2 大维度全面ᨀ升催收效率....................................................................................792 3 堂课,从 0-1 掌握基于数据驱动的风险定价核心...............................................792 如何打造现金贷产品的风控体系?........................................................................792 解密 P2P 网贷备案——专家教你如何正确应对备案..............................................793 区块链的前世今生及其应用 ...................................................................................793 区块链热潮下不可不知的法律风险:法律专家权威解读区块链、代币等案例与法律 分析 .........................................................................................................................793 牌照决定生死,现金贷及 P2P 如何拿牌?............................................................793
评论 1
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值