对模型评价指标AUC的理解

最新推荐文章于 2024-08-23 00:53:11 发布

原创最新推荐文章于 2024-08-23 00:53:11 发布 · 7.2k 阅读

24 ·

CC 4.0 BY-SA版权

文章标签：

#数据挖掘 #机器学习

本文深入解析AUC与ROC曲线在机器学习模型评估中的应用，详细解释了AUC的物理意义，ROC曲线的绘制方法及AUC计算方式。通过案例分析，帮助读者理解AUC在样本不平衡情况下的评价优势。

AUC是一种衡量机器学习模型分类性能的重要且非常常用的指标,其只能用于二分类的情况.
AUC的本质含义反映的是对于任意一对正负例样本,模型将正样本预测为正例的可能性大于将负例预测为正例的可能性的概率( :-) 没办法这句话就是这么绕, rap~).

AUC作为数值,那么到底是怎么来的?怎么理解它的意义?

在真正接触AUC之前,还需要了解两个概念, 分别是混淆矩阵(confusion matrix) 和 ROC曲线.

混淆矩阵:

混淆矩阵.png
可以看出混淆矩阵由四个值构成:

TP : 真实类别为1,且预测结果为1的样本个数,预测正确.
FP : 真实类别为0,且预测结果为1的样本个数,预测错误.
FN : 真实类别为1,且预测结果为0的样本个数,预测错误.
TN : 真实类别为0,且预测结果为0的样本个数,预测正确.

由混淆矩阵可以计算得到ROC曲线的关键参数:TPR(真正例率) 和 FPR(假正例率).
$\frac{TP} {(TP + FN)} = \frac{TP}{P} \tag{1}$

对TPR最通俗易懂的理解即将正例预测为正例的比例

$\frac{FP} {(FP + TN)} = \frac{FP}{N} \tag{2}$

对FPR最通俗易懂的理解即将负例预测为正例的比例(注意: TPR和FPR分子上表示的都是模型将样本预测为正例的情况,不过一个是预测正确一个是预测错误)

理解到这个程度就可以接触ROC曲线了
ROC curve

可以从图上面看出,FPR和TPR分别是ROC曲线的横坐标和纵坐标.对于ROC曲线有四个点需要单独拎出来理解,这对理解AUC也是很有帮助的.它们分别是:

[0, 0] : FPR,TPR均为0.根据式(1)(2)可以得到即TP=FP=0,其含义为模型将所有样本均预测为负例.
[0, 1] : FPR=0,TPR=1. 根据式(1)(2)可以得到即FP=FN=0,其含义为模型做出了没有任何错误的完美预测(由此可以看出ROC曲线越是向上凸(贴近上边界),曲线上的点的纵坐标(TPR)越是大,代表模型的性能越好).
[1, 0] : FPR =1,TPR=0.根据式(1)(2)可以得到即TP=TN=0,其含义为模型做出的预测全部错误(由此可以看出,ROC曲线越是贴近下边界(下凹),那么模型的性能越是差).
[1, 1] : FPR =1,TPR=1.根据式(1)(2)可以得到即TN=FN=0,其意义为模型将所有样本均预测为正例.

此外,对于图ROC curve中的三根曲线的理解:

黑线: 几何含义即ROC图的对角线, 数值含义即TPR = FPR,物理含义即对于任意抽取的样本,模型将其中正例预测为正例的概率和将负例预测为正例的概率是相等的.这也就意味着和随机分类的性能一样.
红蓝色线: 通常来讲, 我们的机器学习模型要优于随机分类器,因此我们经常看到的曲线往往都是像蓝色线和红色线一样的ROC曲线.它们相比黑线是有明显上凸的,同样的横坐标(FPR)下,红蓝线纵坐标(TPR)是大于黑线的,即代表模型将正例预测为正例的概率要大于将负例预测为正例的概率.同理可以看出蓝线模型由于红线模型.

如果要将上述的标准进行定量评估,就延伸得到了AUC, AUC即ROC曲线下方与坐标轴围成的面积大小

AUC(Area under the ROC curve)

AUC更直观地反应了ROC曲线向我们表达的模型分类能力.其数值大小(越大越好)代表了模型的性能优劣.说到这里,自然也就能够明白开篇关于AUC物理意义的阐述了,重申一遍即:AUC的本质含义反映的是对于任意一对正负例样本,模型将正样本预测为正例的可能性大于将负例预测为正例的可能性的概率(例如: 当AUC = 0.5, ROC曲线为黑线时, 模型将一对正负例样本中的正样本预测为正例的概率为0.5,将负样本预测为正例的概率也为0.5,等效于随机分类预测).