评分卡建模流程

本文介绍了评分卡建模流程,涉及风控与互联网金融领域。内容包括logit函数及其在logistic回归模型中的应用,探讨了如何利用优势比进行模型构建。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

基于Logistic回归的申请评分卡模型开发
基本申请评分卡建模流程:
1.数据准备:收集并整合在库客户的数据,定义目标变量,排除特定样本。
2.探索性数据分析:评估每个变量的值分布情况,处理异常值和缺失值。
3.数据预处理:变量筛选,变量分箱,WOE转换、样本抽样。
4.模型开发:逻辑回归拟合模型。
5.模型评估:常见几种评估方法,ROC、KS等。
6.生成评分卡



1. 数据准备
因为不同评级模型所需要的数据也是不同的,所以在开发信用评级模型之前,要先明确我们需要解决的问题。
1.1 排除一些特定的建模客户
用于建模的客户或者申请者必须是日常审批过程中接触到的,需要排除异常情况。如 欺诈,特殊客户。
1.2 明确客户属性
根据不同的数据来源,可以分为以下几类:
1.人口统计特征:客户的基本特征,如性别,年龄、居住情况、年收入等
2.征信机构数据和外部评分:如人行征信报告、芝麻分等。
3.其他数据来源。
1.3 目标变量的确立
预测模型的一个基本原理是用历史数据来预测未来,申请者评分模型需要解决的问题是未来一段时间(如12个月)客户出现违约(如至少一次90天或90天以上逾期)的概率。先将客户标签定义为二分类,不良/逾期:观察窗口内,观察窗口内,60/90/120天算逾期日期;良好:从未或截止逾期;从未或在观察期内截止逾期
其中关于不良/逾期需要界定以下两项内容:确定违约日期时长、观察窗口期设置。
定违约日期时长
违约时长的确定可以使用逾期转移矩阵来确定

(以上数据纯属虚构)
通过上图可以看出来,M3客户变坏的概率为93%.也就是说当客户逾期超过60天后,被催回的几率为7%。因此,可以定义逾期超过60天的客户为坏客户。
违约窗口期设置——账龄分析

一般情况下巴塞尔协议硬性要求12个月及以上作为窗口期。一般情况下,观察窗口=3-5倍的预测窗口,同时决定信用评等模型开发所需数据期间长度,一般又会从最新资料的留存时点开始推算,利用账龄分析观察目标客户的违约成熟期长度,借此设定观察期长度(预测窗口的时间长度)。比如2017.04开卡的人,第10个月,稳定成熟了,观察窗口时间可以确定为10-12个月;2017.05开卡的人,第11个月,稳定成熟了,观察窗口时间可以确定为11-12个月。
好坏客户标签
通过观察转移矩阵和账龄,我们定义在10-12月逾期超过60天的客户为坏客户。同时第十个月没有发生逾期的客户定义为好客户。那逾期天数在0-60之间的客户怎么定义呢,,比如45天,这样的客户不能简单的将其归为好客户或坏客户,需要暂时将他从模型样本中摘除,将其定义为不确定的客户。

2.数据描述和探索性数据分析
数据准备和数据预处理阶段消耗大量的时间,主要的工作包括数据获取、探索性数据分析、缺失值处理、数据校准、数据抽样、数据转换、离散变量降维、连续变量优先分段等工作。
EDA实施包含以下过程:
描述性统计。
评估每个变量值的分布并检验正态假设
极端值的识别和处理
缺失值的计算和处理
2.1 描述性统计
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值