目标检测中Recall、Precision和IOU

最新推荐文章于 2024-01-23 15:57:45 发布

转载最新推荐文章于 2024-01-23 15:57:45 发布 · 1.4w 阅读

DeepLearning 专栏收录该内容

18 篇文章

订阅专栏

本文通过一个假设的测试集示例，介绍了在YOLOv2训练过程中使用的评估指标，包括Precision、Recall和IoU的具体含义及计算方法，并讨论了如何通过调整阈值来平衡这些指标。

部署运行你感兴趣的模型镜像

摘要

在训练YOLO v2的过程中，系统会显示出一些评价训练效果的值，如Recall，IoU等等。为了怕以后忘了，现在把自己对这几种度量方式的理解记录一下。
这一文章首先假设一个测试集，然后围绕这一测试集来介绍这几种度量方式的计算方法。

大雁与飞机

假设现在有这样一个测试集，测试集中的图片只由大雁和飞机两种图片组成，如下图所示：
这里写图片描述

假设你的分类系统最终的目的是：能取出测试集中所有飞机的图片，而不是大雁的图片。

现在做如下的定义：
True positives : 飞机的图片被正确的识别成了飞机。
True negatives: 大雁的图片没有被识别出来，系统正确地认为它们是大雁。
False positives: 大雁的图片被错误地识别成了飞机。
False negatives: 飞机的图片没有被识别出来，系统错误地认为它们是大雁。

假设你的分类系统使用了上述假设识别出了四个结果，如下图所示：
这里写图片描述

那么在识别出的这四张照片中：
True positives : 有三个，画绿色框的飞机。
False positives: 有一个，画红色框的大雁。

没被识别出来的六张图片中：
True negatives : 有四个，这四个大雁的图片，系统正确地没有把它们识别成飞机。
False negatives: 有两个，两个飞机没有被识别出来，系统错误地认为它们是大雁。

Precision 与 Recall

Precision其实就是在识别出来的图片中，True positives所占的比率：
这里写图片描述
其中的n代表的是(True positives + False positives)，也就是系统一共识别出来多少照片。
在这一例子中，True positives为3，False positives为1，所以Precision值是 3/（3+1）=0.75。
意味着在识别出的结果中，飞机的图片占75%。

Recall 是被正确识别出来的飞机个数与测试集中所有飞机的个数的比值：
这里写图片描述
Recall的分母是(True positives + False negatives)，这两个值的和，可以理解为一共有多少张飞机的照片。
在这一例子中，True positives为3，False negatives为2，那么Recall值是 3/（3+2）=0.6。
意味着在所有的飞机图片中，60%的飞机被正确的识别成飞机.。

调整阈值

你也可以通过调整阈值，来选择让系统识别出多少图片，进而改变Precision 或 Recall 的值。
在某种阈值的前提下（蓝色虚线），系统识别出了四张图片，如下图中所示：
这里写图片描述
分类系统认为大于阈值（蓝色虚线之上）的四个图片更像飞机。

我们可以通过改变阈值（也可以看作上下移动蓝色的虚线），来选择让系统识别能出多少个图片，当然阈值的变化会导致Precision与Recall值发生变化。比如，把蓝色虚线放到第一张图片下面，也就是说让系统只识别出最上面的那张飞机图片，那么Precision的值就是100%，而Recall的值则是20%。如果把蓝色虚线放到第二张图片下面，也就是说让系统只识别出最上面的前两张图片，那么Precision的值还是100%，而Recall的值则增长到是40%。

IoU

IoU这一值，可以理解为系统预测出来的框与原来图片中标记的框的重合程度。
计算方法即检测结果Detection Result与 Ground Truth 的交集比上它们的并集，即为检测的准确率：

I o U = D e t e c t i o n R e s u l t ⋂ G r o u n d T r u t h D e t e c t i o n R e s u l t ⋃ G r o u n d T r u t h

如下图所示：
蓝色的框是：GroundTruth
黄色的框是：DetectionResult
绿色的框是：DetectionResult ⋂ GroundTruth
红色的框是：DetectionResult ⋃ GroundTruth

这里写图片描述

备注：博客来源-http://blog.youkuaiyun.com/hysteric314/article/details/54093734

您可能感兴趣的与本文相关的镜像

Yolo-v5

Yolo

YOLO（You Only Look Once）是一种流行的物体检测和图像分割模型，由华盛顿大学的Joseph Redmon 和Ali Farhadi 开发。 YOLO 于2015 年推出，因其高速和高精度而广受欢迎

5 条评论

WFForstar 2021.12.10
真不错讲的

Xgq哈哈哈哈 2020.08.21
我想问下如果模型把图片中的一个背景识别成飞机那么这个属于什么类
- 影醉阏轩窗回复Xgq哈哈哈哈 2020.10.09
  他转载的这篇文章说明的不好，应该用正负样本去，正样本就是你想识别的种类（飞机），负样本就是其他（包括大雁、背景、不是飞机的东西）

力拔山兮气盖世~ 2019.03.18
您好，您的解释很形象，我想引用大雁和飞机的图片一下，在图片前面我会备注图片链接，并在显眼处附上您的博客链接，您看可以吗？
- 奔跑熊回复力拔山兮气盖世~ 2019.03.20
  [reply]qq_33948796[/reply] 没问题的，这篇博客我也是转载别人的，好东西就要一起分享。