PR曲线和ROC曲线概念及其区别

最新推荐文章于 2025-04-07 21:09:57 发布

原创

最新推荐文章于 2025-04-07 21:09:57 发布 · 1.5w 阅读

37 ·

CC 4.0 BY-SA版权

文章标签：

#PR和ROC曲线

PR曲线关注精度与召回率，适用于正负样本不平衡的情况，而ROC曲线关注真正例率与假正例率，适用于衡量所有样本的性能。两者在样本比例接近时区别不大，但在正样本稀少时，PR曲线更能体现分类器性能。AUC作为评价指标，值越大表示分类效果越好。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

知识点

Precision=TP/(TP+FP)
Recall=TP/(总的正样本)=TP/(TP+FN) # 这个时候的
TPR=TP/(TP+FN)=Recall # 真正例率
FPR=FP/(TN+FP) #
PR曲线
横Recall，纵Precision
PR曲线的绘制
场景：有限样本。
方法：固定分类阈值（比如0.5），对分类器的预测结果按照置信度进行降序排序，然后按此顺序对样例进行预测，每次可以计算出当前的查全率（Recall）和查准率（Precision），然后以此作图，绘制出P-R曲线。（疑惑？？：P-R曲线是按照固定的分类阈值，还是按照西瓜书所讲，按照置信度降序的顺序，逐个把样本作为正例进行预测？？我做商汤的笔试题，是采取固定分类阈值的策略）
ROC曲线 横FPR，纵TPR，理想的情况是TPR=1，FPR=0，一般来说，FPR增大，则TPR也会跟着增大。
ROC曲线的绘制：
场景：有限样本。
方法：卡阈值，对学习器的预测结果排序，排在前面的是最可能为正例的样本，最后的是最不可能的样本，然后计算不同阈值下的TPR和FPR值，绘制出曲线。
卡阈值作为正负样本的判定依据，阈值较高时，Precision比较大，阈值较低时，Recall较大。（推荐的话，想Precision较大，用户希望排名靠前的推荐是自己想要的，刑侦的话希望Recall较大，不错过一个犯人）
AUC：ROC曲线下面积。
PR和ROC曲线应用范围：
1.当正负样本比例差不多的时候，两者区别不大。
2.PR曲线比ROC曲线更加关注正样本，而ROC则兼顾了两者。
3.AUC越大，反映出正样本的预测结果更加靠前。（推荐的样本更能符合用户的喜好）
4.当正负样本比例失调时，比如正样本1个，负样本100个，则ROC曲线变化不大，此时用PR曲线更加能反映出分类器性能的好坏。
5.PR曲线和R