对于分类模型,在建立好模型后,我们想对模型进行评价,常见的指标有混淆矩阵、F1值、KS曲线、ROC曲线、AUC面积等。也可以自己定义函数,把模型结果分割成n(100)份,计算top1的准确率、覆盖率。之前阐述了混淆矩阵、KS曲线和F1值,本文阐述ROC曲线的原理和Python实现实例,其它指标会在后续文章中详尽阐述,敬请期待图片。
一、详细介绍ROC曲线
1 什么是ROC曲线
ROC曲线又称为受试者特征曲线(Receiver Operating Characteristic Curve):是分类问题的一个衡量指标。它是以假阳性率FPR(False Positive Rate)为横轴,真阳性率TPR(True Positive Rate)为纵轴,调整不同阈值绘制的一条曲线。ROC曲线越靠近左上角说明模型预测效果越好,至于原因详见后文。
2 理解ROC曲线的一个小例子
假设1代表涉赌涉诈账户,0代表非涉赌涉诈的正常账户。