[风控-001]金融风控之评分卡:从本质到精通--001

本文介绍了金融风控中评分卡的构建过程,包括问题描述、优化求解、信用分计算和WOE(Weight of Evidence)替换。通过最大似然估计方法优化线性模型,利用WOE值对特征进行分段,提高模型的解释性和信用分的计算效率。

pdf文件在 https://download.youkuaiyun.com/download/u011539200/10865606  

1.问题描述

假设有n个样本,每个样本表示一个贷款客户的信息。第i个样本表示为\{x_i,y_i\},其中x_i\in R^{r\times1}y_i\in\{0,1\}

具体地说,x_i是一个r维向量,每一个维度表示贷款人的一个属性变量。这r个变量,是经过填充数据缺失、去除离群点、去除高相关性变量、筛选高IV等之后的入模变量。y_i的值是0或1,y_i=1表示逾期,y_i=0表示正常。

写成矩阵的形式,n个样本全部数据,可以写成如下形式:

X=\left[ \begin{matrix} x_{1,1} & x_{1,2} &... & x_{1,r} \\ x_{2,1} & x_{2,2} &... & x_{2,r} \\ ... & ... & ...&...\\ x_{n,1} & x_{n,2} & ... &x_{n,r}\\ \end{matrix} \right]

Y=\left[ \begin{matrix} y_{1}\\ y_{2}\\ ...\\ y_{n}\\ \end{matrix} \right]


2.优化求解

对客户i而言,如果其逾期的概率是p_i,那么其正常的概率就是1-p_i,一个客户要么逾期要么正常,逾期和正常的概率之和必然是1。

我们需要根据x_i评估用户i是否会逾期。对于构建模型而言,最简单的是线性模型。在线性模型,就是:

z_i=\beta_0+\beta_1x_{i,1}+\beta_2x_{i,2}+...+\beta_rx_{i,r}
其中,

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值