OpenMMLab AI实战训练营day6-目标检测与MMDetection

最新推荐文章于 2025-12-19 10:41:59 发布

原创最新推荐文章于 2025-12-19 10:41:59 发布 · 143 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能 #目标检测 #深度学习

文章介绍了目标检测的基本范式，包括滑窗方法及其效率问题，以及如何使用卷积实现密集预测来改进。锚框的概念被提出，用于处理相近检测框的冗余，而非极大值抑制则用来选择最高置信度的预测结果。多尺度检测结合FPN（FeaturePyramidNetwork）是当前的常用技术，提高了检测性能。

OpenMMLab AI实战训练营day6-目标检测与MMDetection

目标检测的基本范式

目标检测的基本范式

滑窗

一个好的检测器应满足不重，不漏的要求
滑窗是实现这个要求的一个朴素手段
具体操作方法
1，设定一个固定大小的窗口
2。遍历图像所有位置，所到之处用分类模型识别窗口中的内容
在这里插入图片描述
滑窗的效率问题
考虑1000×600大小的图像，设定100×100的窗口，每滑动20像素分类一次
仅推理─张图片，需对46×26~1200个窗口进行分类
若使用不同大小的窗口，分类次数成倍增加
改进思路1:使用启发式算法替换暴力遍历用相对低计算量的方式粗筛出可能包含物体的位置，再使用卷积网络预测早期二阶段方法使用，依赖外部算法，系统实现复杂
改进思路2:减少冗余计算，使用卷积网络实现密集预测目前普遍采用的方式

使用卷积实现密集预测

在这里插入图片描述

锚框

在这里插入图片描述
非极大值预测
滑窗类算法通常会在物体周围给出多个相近的检测框这些框实际指向同一物体，只需要保留其中置信度最高的
置信度
置信度(Confidence Score)︰模型认可自身预测结果的程度，通常需要为每个框预测一个置信度我们倾向认可置信度高的预测结果，例如有两个重复的预测结果，丢弃置信度低的
·部分算法直接取模型预测物体属于特定类别的概率
·部分算法让模型单独预测一个置信度（训练时有GT，可以得相关信息作为监督)
非极大值抑制流程
在这里插入图片描述

多尺度检测与FPN

在这里插入图片描述

OpenMMLab AI实战训练营day6-目标检测与MMDetection

OpenMMLab AI实战训练营day6-目标检测与MMDetection

目标检测的基本范式

滑窗

使用卷积实现密集预测

锚框

多尺度检测与FPN

1 条评论