精度和召回率

最新推荐文章于 2025-06-06 15:02:21 发布

追光少年呀

最新推荐文章于 2025-06-06 15:02:21 发布

阅读量4k

点赞数 4

CC 4.0 BY-SA版权

分类专栏：机器学习文章标签：分类指标机器学习

本文链接：https://blog.youkuaiyun.com/aLWX_hust/article/details/86546166

本文探讨了在分类任务中选择正确衡量指标的重要性，特别是针对不平衡数据集。精度和召回率作为主要指标，分别表示分类正确率和查全率。精度关注正确分类的正例比例，召回率关注所有正例被正确识别的比例。文章还讨论了精度与召回率之间的权衡，并介绍了F1分数作为综合评价方法。此外，通过混淆矩阵和ROC曲线的可视化，进一步阐述了如何评估和调整模型的性能。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一、为分类任务选择正确的衡量指标

不平衡的分类问题：如恐怖分子检测、当疾病在公众中的发病率很低时的疾病监测等
有这么一个模型：将从美国机场起飞的所有乘客简单地标注为非恐怖分子。已知美国全年平均有 8 亿人次的乘客，并且在 2000-2017 年间共发现了 19 名恐怖分子，这个模型达到了接近完美的准确率——99.9999999%。
在恐怖分子检测的问题中宣布所有的数据点为负例（非恐怖分子）是毫无裨益的，相反，我们应该聚焦于正例（恐怖分子）的识别。
直觉告诉我们，我们应该最大化的是统计学上称为召回率或查全率（recall）的衡量指标，或者是最大化模型找到数据集中所有相关案例的能力。
精度：P = TP/(TP+FP);
反映了被分类器判定的正例中真正的正例样本的比重。
准确率（Accuracy）
A = (TP + TN)/(P+N) = (TP + TN)/(TP + FN + FP + TN);
反映了分类器统对整个样本的判定能力——能将正的判定为正，负的判定为负。
召回率(Recall && True Positive Rate)
Recall=TP/(TP+FN);
反映了所有真正为正例的样本中被分类器判定出来为正例的比例
精度就是找得对，召回率就是找得全。
精度（查准率）不冤枉一个好人
召回率（查全率）不放过一个坏人
大概就是你问问一个模型，这堆东西是不是某个类的时候，准确率就是它说是，这东西就确实是的概率吧，召回率就是，它说是，但它漏说了（1-召回率）这么多。