文章目录
前面,我们提到了混淆矩阵,以及根据混淆矩阵进一步计算得到的敏感度(召回率)、特异度、精确度、准确度、F1 Score等等。那他们的前提都是要首先确定一个截断阈值。
【模型评估】混淆矩阵(confusion_matrix)之 TP、FP、TN、FN;敏感度、特异度、准确率、精确率
这个截断阈值选取多少比较合适呢?这里就需要引入ROC曲线了,一个衡量模型整体性能的参数。
一、什么是ROC(Receiver Operating Characteristic)
在上一章计算混淆矩阵时候,我们提到:混淆矩阵的绘制严重依赖一个固定的截断阈值,大于这个阈值的是阳性,反之则是阴性。
在确定该阈值的前提下,才能确定混淆矩阵的数值,这种对模型评价方式是片面的,不够全局的,没有从整体上评价一个模型的性能。
此时,迫切需要一中评价方式,能够更加全面的对模型进行评估。既然一个截断阈值的评价是片面的,那么我尽可能的多取一些阈值,综合起来评价,那是不是就可以避免这个问题呢?于是就出现的ROC曲线,如下所示:

其中:
ROC曲线和AUC值是衡量二分类模型性能的重要指标。ROC曲线通过假阳性率与真阳性率展示模型在不同阈值下的表现,AUC值则表示模型区分正负样本的能力。本文详细介绍了ROC曲线的绘制方法,包括sklearn库的使用、多分类ROC曲线、FROC曲线以及MedCalc软件绘制,并探讨了AUC值的意义和数据不平衡对其的影响。
订阅专栏 解锁全文
2634

被折叠的 条评论
为什么被折叠?



