写在前面的话
无论是目标检索、分类、还是检测,都有其自身的一套评价指标体系。可能其中很多概念很类似,比如精确度、召回率。但其实内涵还是有些不一样的。身为一个已经搞了一年图像目标检测的后进者,直到现在才发现,之前我以为轻松搞懂的评价标准,其实是错误的。今天特就自己翻阅的资料做一个汇总,不敢保证对,但至少修正了一部分自以为是的思想。
在网上之前看到的很多打着目标检测评价指标的博文,其实只是对分类做的评价。而检测的实质是分类+定位。所以没有牵扯到 IoU 概念的统统都是耍流氓~
好了闲话少叙,我们言归正传…
-----------------------------------------------------------------------------------------------------------------------------------------
1 目标检测一些基本概念
这部分包含但不限于
- 什么是 目标检测?
- 什么是 Ground Truth?
- 什么是 IoU?
- 精确度 Precision 和召回率 Recall 的絮絮叨叨概念,不想看的可以直接跳到 2 mAP 那里
可以参考 目标检测的评估指标mAP的那些事儿 中的相关部分。
2 mAP
TP: IoU>0.5的检测框数量(同一 Ground Truth 只计算一次)
FP: IoU<=0.5的检测框,或者是检测到同一个 GT 的多余检测框的数量
FN: 没有检测到的GT的数量
Precision: TP / (TP + FP)
Recall: TP / (TP + FN)
PR曲线: Precision-Recall曲线
AP: PR曲线下的面积,综合考量了 recall 和 precision 的影响,反映了模型对某个类别识别的好坏。
mAP: mean Average Precision, 即各类别AP的平均值,衡量的是在所有类别上的平均好坏程度。
-----------------------------------------------------------------------------------------------------------------------------------------
在目标检测中,mAP的定义首先出现在PASCAL Visual Objects Classes(VOC)竞赛中,这个大赛包含许多图像处理任务。
我们要注意,在计算Precision和Recall,至少有两个变量会影响 Precision 和 Recall,即 IoU 和