理解目标检测中的mAP指标(1)

最新推荐文章于 2025-05-18 18:46:30 发布

huangeryu

最新推荐文章于 2025-05-18 18:46:30 发布

阅读量1.7k

点赞数

CC 4.0 BY-SA版权

分类专栏：目标检测

原文链接：https://medium.com/@timothycarlen/understanding-the-map-evaluation-metric-for-object-detection-a07fe6962cf3

目标检测专栏收录该内容

1 篇文章

订阅专栏

本文介绍了目标检测模型评估的重要指标mAP，包括mAP的含义、为什么在目标检测中使用mAP、如何计算mAP，以及AP与IOU的概念。通过理解mAP和IOU，可以更好地评估模型在分类和定位任务上的性能。文中还提到了PASCAL VOC和COCO挑战赛中mAP的计算方式。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

如果你已经评估过目标检测模型或者读过这个领域的相关论文，那你一定碰到“平均均值精确率”或者“mAP”这个概念。mAP被目标检测竞赛（比如PASCAL VOC,ImageNet以及COCO ）当做模型性能评估的一种方式。在这篇文章中，我将介绍：

mAp是什么？
为什么mAP在目标检测中是一种有用的度量方式
对于特定的类别如何计算mAP

另外，我将提供计算mAP的代码方便读者可以在自己的项目中使用

检测模型的评估

在物体检测领域，模型评估是非常重要的，因为存在两个不同的任务需要度量：

决定一个物体是否存在一副图片中（分类）
决定物体在图片中的位置（定位，回归任务）

还有，在这些经典的数据集往往拥有多个类别并且类别的分布不是均匀的（比如含狗的图片比冰淇淋更多）。因此基于准确率的度量会带来偏差。同时，对错分类的风险评估也是很重要的。因此需要将一个自信度分数或者模型的分数与检测框联系在一起，在各种不同的标准的自信度下对模型的评估。

为了满足这些需求，AP（Average Precision）这个概念被引入。为了理解AP需要理解分类器的精确率与召回率。关于这些术语的的全面解释，可以查看wikipedia article。简洁的的说，精确率衡量分类器预测的所有物体中是真正物体的概率。如果模型的精准率接近1.0，表示预测到的物体有很高的可能是真实的物体。召回率衡量的是在数据集所有物体中分类器能够预测到的物体的概率。如果模型的召回率接近1.0，表示数据集中的所有物体有几乎都可以预测到。注意，精准率与召回率存在负相关，并且这两个衡量指标依赖于给定模型的分数阈值。举例来说，这张图片来自与TensorFlow物体检测API，如果我们对kite类别设置模型的分数阈值为50%，就可以获得7个正样本类别，但是如果我们设置我们的模型分数阈值为90%，就只存在4个正样本类别。

为了计算AP，对给定类别（比如人）精确率-召回率（PR）曲线可以通过调整模型的分数阈值计算模型的检测输出计算得到。PR曲线看起来是这样的：

计算AP的最后一个步骤取所有召回率下的精准率的平均值（说明请查看Pascal Challenge paper4.2节),AP是对PR曲线的求和，更具体来说，AP曲线可以定义为在11个等距的召回率， $Recall_i=[0,0.1,0.2,...,1.0]$ ，上精准率的平均值，如下公式：
${AP}=\frac {1} {11}\sum_{Recall_i}{Precision(Recall_i)}$
注意，召回率i时的精准率取超过召回率i时的最大精准率值，用公式表示如下：
$Precision(Recall_i)=\max_{i<r} {Recall_r}$