OpenMMLab AI实战训练营day6-目标检测与MMDetection

文章介绍了目标检测的基本范式,包括滑窗方法及其效率问题,以及如何使用卷积实现密集预测来改进。锚框的概念被提出,用于处理相近检测框的冗余,而非极大值抑制则用来选择最高置信度的预测结果。多尺度检测结合FPN(FeaturePyramidNetwork)是当前的常用技术,提高了检测性能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

OpenMMLab AI实战训练营day6-目标检测与MMDetection

目标检测的基本范式

滑窗

一个好的检测器应满足不重,不漏的要求
滑窗是实现这个要求的一个朴素手段
具体操作方法
1,设定一个固定大小的窗口
2。遍历图像所有位置,所到之处用分类模型识别窗口中的内容
在这里插入图片描述
滑窗的效率问题
考虑1000×600大小的图像,设定100×100的窗口,每滑动20像素分类一次
仅推理─张图片,需对46×26~1200个窗口进行分类
若使用不同大小的窗口,分类次数成倍增加
改进思路1:使用启发式算法替换暴力遍历用相对低计算量的方式粗筛出可能包含物体的位置,再使用卷积网络预测早期二阶段方法使用,依赖外部算法,系统实现复杂
改进思路2:减少冗余计算,使用卷积网络实现密集预测目前普遍采用的方式

使用卷积实现密集预测

在这里插入图片描述

锚框

在这里插入图片描述
非极大值预测
滑窗类算法通常会在物体周围给出多个相近的检测框这些框实际指向同一物体,只需要保留其中置信度最高的
置信度
置信度(Confidence Score)︰模型认可自身预测结果的程度,通常需要为每个框预测一个置信度我们倾向认可置信度高的预测结果,例如有两个重复的预测结果,丢弃置信度低的
·部分算法直接取模型预测物体属于特定类别的概率
·部分算法让模型单独预测一个置信度(训练时有GT,可以得相关信息作为监督)
非极大值抑制流程
在这里插入图片描述

多尺度检测与FPN

在这里插入图片描述

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值