风控模型指标详解

最新推荐文章于 2024-09-02 21:18:55 发布

Labryant

最新推荐文章于 2024-09-02 21:18:55 发布

阅读量3.8k

点赞数 1

文章标签：风控 PSI CSI AUC WOE

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/lc434699300/article/details/103392409

版权

本文详细介绍了风控模型中常用的评估指标，包括P-R曲线、ROC和AUC、WOE和IV值、K-S值、PSI和CSI的区别，以及Lift曲线。在P-R曲线与ROC曲线的区别中，指出P-R曲线在正负样本分布不均时更能反映模型性能。WOE和IV值用于衡量变量预测强度，而K-S值和Lift曲线则用于衡量模型区分坏账的能力。PSI和CSI分别用于群体稳定性和特征稳定性的评估，帮助理解模型分数波动的原因。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

目录：

1.P-R曲线
2.ROC,AUC
- P-R曲线和ROC曲线的区别
3.WOE.IV值
4.K-S值
KS曲线与ROC曲线的区别
5.PSI,CSI
6.Lift曲线

1.P-R曲线

　首先，明确两个概念，精确率§和召回率®。下表中，1代表正例，0代表负例。

在这里插入图片描述

$P=\frac{TP}{P}=\frac{TP}{TP+FP}$
$R=\frac{TP}{R}=\frac{TP}{TP+FN}$

　精确率是指分类正确的正样本个数占分类器判定为正样本个数的比例。它表示的是预测为正的样本中有多少是真正的正样本。
召回率是指分类正确的样本个数占真正的正样本个数的比例，它表示的是样本中的正例有多少被预测正确了。这里可以参看西瓜书，里面好瓜坏瓜的例子，比较容易理解。

　Precision和Recall是既矛盾又统一的两个指标，为了提高Precision,分类器需要尽量在“更有把握”时才把样本预测为正样本，但此时往往会因为过于保守而漏掉很多“没有把握”的正样本，导致Recall很低。

　接下来说回P-R曲线，横轴是召回率R,纵轴是精确率P。对于P-R曲线上的一点，表示在某一阈值下，模型将大于该阈值的结果判定为正样本，小于该阈值的结果判定为负样本，此时返回结果对应的P和R。一般的P-R曲线如下图：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-tOhuUphD-1575456885844)(./image/PR曲线.jpg)]
注意，只用某个点对应的精确率和召回率无法全面衡量模型性能。

2.ROC,AUC

　介绍ROC之前，先看几个指标，假阳率(FPR)和真阳率(TPR)。

$FPR=\frac{FP}{N}=\frac{FP}{FP+TN}$
$TPR=\frac{TP}{P}=\frac{TP}{TP+FN}$

最低0.47元/天解锁文章

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。