ROC曲线

菜鸟小丁

已于 2023-04-24 16:17:23 修改

阅读量3.6k

点赞数 6

分类专栏：笔记文章标签：机器学习算法深度学习

于 2021-07-15 10:33:02 首次发布

本文链接：https://blog.youkuaiyun.com/m0_49361060/article/details/118752957

版权

笔记专栏收录该内容

4 篇文章

订阅专栏

ROC曲线是评估分类模型性能的重要工具，它通过绘制真正例率(TPR)与假正例率(FPR)的关系来展示模型的辨别能力。文章介绍了ROC曲线的计算方法，包括将样本按概率排序，设定阈值，计算TPR和FPR，并举例说明如何根据概率绘制ROC曲线坐标点。TPR表示正类预测准确率，FPR表示误判负类的比例。通过ROC曲线，可以直观地看出模型在不同阈值下的表现。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

ROC曲线是一种用来度量分类模型好坏的一个标准，全名叫做Receiver Operating Characteristic。ROC曲线绘制时，首先将每个样本属于正样本的概率进行大小排序，再依次以每个样本属于正样本的概率作为阈值。高于这个阈值被视为正样本，低于这个阈值视为负样本。由此进行计算，得到该样本的FPR和TPR，并以此为坐标点。
TPR代表分类器预测的正类中实际正实例占所有正实例的比例。
FPR代表分类器预测的正类中实际负实例占所有负实例的比例
计算公式分别为
$\\TPR = \frac{{TP}}{{TP + FN}}\\$
$\\FPR = \frac{{FP}}{{FP + TN}}\,$
参考ROC绘制实例如下：
在这里插入图片描述
score即为每个样本属于正样本的概率，class为样本真实的类别。
计算部分样本的坐标点（TPR,FPR）
以第3个样本为例，此时样本属于正样本的概率为0.7，所以以0.7作为阈值。概率大于0.7的样本视为正样本，小于0.7的是负样本。即样本1、2、3都被视为正样本，其余样本为负样本。此时的TP（被正确分类的正例）有2个，FN(被错分为负例的正例)有8个，TN（True Negative被正确分类的负例）有9个、FP（False Positive被错分为正例的负例）有1个，所以此时TPR为0.2，FPR为0.1
在这里插入图片描述
绘制ROC曲线

小菜鸟刚刚搞懂的基础概念自我记录一下