
Pyi:是这个组中响应客户(坏样本)占所有样本中所有响应客户的比例
Pni:是这个组中未响应客户(好样本)占样本中所有未响应客户的比例
#yi:是这个组中响应客户的数量
#ni:是这个组中未响应客户的数量
#yT:是样本中所有响应客户(总的坏样本)的数量
#nT:是样本中所有未响应客户(总的好样本)的数


用以评估模型对好、坏客户的判别区分能力,计算累计坏客户与累计好客户百分比的最大差距。
KS值:代表模型的分割样本的能力,不能表示分割的是否准确,即便好坏客户完全分错,K-S值依然可以很高,
通常来讲,KS>0.2即表示模型有较好的预测准确性
KS的计算步骤如下:
|
|
4.lift值
Lift曲线衡量的是:与不利用模型相比,模型的预测能力“变好”了多少,lift(提升指数)越大,模型的运行效果越好。实质上它强调的是投入与产出比
先介绍几个相关的指标,以免混淆:
- 准确率(accuracy,ACC):

- 正确率(Precision,PRE),查准率:

- 真阳性率(True Positive Rate,TPR),灵敏度(Sensitivity),召回率(Recall):

- 假阳性率(False Positice Rate,FPR),误诊率( = 1 - 特异度):


5.PSI:群体稳定性指标(popularity stability index),用于衡量模型或特征的稳定性
psi = sum((实际占比-预期占比)* ln(实际占比/预期占比))
<0.1: 稳定性很高,
[0.1,0.25]:稳定性一般,
>0.25: 模型稳定性差,建议重做
本文介绍了信用评分模型中的核心指标,包括WOE、IV、KS、Lift和PSI等,详细解释了它们的计算方法及在评估模型有效性方面的作用。

4791

被折叠的 条评论
为什么被折叠?



