模型稳定度指标PSI

 群体稳定性指标PSI(Population Stability Index)是衡量模型的预测值与实际值偏差大小的指标。

PSI = sum((实际占比-预期占比)* ln(实际占比/预期占比))

举例:

比如训练一个logistic回归模型,预测时候会有个概率输出p。
测试集上的输出设定为p1吧,将它从小到大排序后10等分,如0-0.1,0.1-0.2,......。
现在用这个模型去对新的样本进行预测,预测结果叫p2,按p1的区间也划分为10等分。
实际占比就是p2上在各区间的用户占比,预期占比就是p1上各区间的用户占比。
意义就是如果模型跟稳定,那么p1和p2上各区间的用户应该是相近的,占比不会变动很大,也就是预测出来的概率不会差距很大。

一般认为PSI小于0.1时候模型稳定性很高,0.1-0.25一般,大于0.25模型稳定性差,建议重做。

PS:除了按概率值大小等距十等分外,还可以对概率排序后按数量十等分,两种方法计算得到的psi可能有所区别但数值相差不大。

 

 

### 风控模型评估指标 #### 准确率 准确率是指预测正确的比例,即被正确分类的数据占总数据的比例。对于风控模型而言,高准确率意味着能够更有效地识别潜在的风险事件[^1]。 #### 召回率 召回率衡量的是实际发生的风险事件中有多少被成功检测出来。这一比率越高说明漏报的情况越少,在金融领域减少损失至关重要[^2]。 #### F1分数 F1分数综合考量了精确度(Precision)和召回率(Recall),它提供了两者之间平衡的一个单一数值表示方法。当面对不平衡类别分布时尤其有用,因为此时单纯依靠准确率可能无法全面反映模型表现[^3]。 #### AUC-ROC曲线下的面积 AUC (Area Under Curve)-ROC (Receiver Operating Characteristic curve) 是一种广泛应用于二元分类器性能评测的方法。该值范围介于0至1之间,理想情况下接近1表明具有良好的区分能力;而靠近0.5则暗示着几乎没有任何判别力[^4]。 ```python from sklearn.metrics import roc_auc_score, f1_score, accuracy_score, recall_score def evaluate_model(y_true, y_pred_proba): auc = roc_auc_score(y_true, y_pred_proba) predictions = [round(value) for value in y_pred_proba] acc = accuracy_score(y_true, predictions) rec = recall_score(y_true, predictions) f1 = f1_score(y_true, predictions) results = { 'Accuracy': round(acc * 100, 2), 'Recall': round(rec * 100, 2), 'F1 Score': round(f1 * 100, 2), 'AUC ROC': round(auc * 100, 2) } return results ``` #### KS统计量 KS 统计量用于测量累积分布函数之间的最大差异,通常用来比较不同评分卡或者概率估计的效果好坏。较高的KS值代表更好的分离效果,有助于判断正负样本间的区别程度. #### PSI指数 PSI (Population Stability Index) 主要关注随着时间推移目标群体特征的变化情况。通过计算新旧两期数据间各区间占比变化绝对值得加权求和来量化稳定性水平。较低的PSI得分意味着人群属性较为稳定,反之则提示可能存在漂移现象需要引起重视并采取相应措施调整模型参数或重新训练新的版本以适应最新市场环境特点.
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值