AI实战训练营(Class 6)目标检测与MMDetection

文章探讨了目标检测的基本范式,对比了目标检测与图像分类的区别,介绍了边界框的表示方法和IoU作为评价标准。重点讲解了滑窗和密集预测策略,以及无锚框检测算法如FCOS、YOLOX和YOLOv8的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

目标检测的基本范式

目标检测 vs 图像分类![请添加图片描述](https://img-blog.csdnimg.cn/6e6f20dab0134499请添加图片描述

目标检测技术的演进

请添加图片描述

框,边界框

描述一个框需要四个像素值,有两种方式:

  • 左上右下坐标(l,t,r,b
  • 中心坐标和边框的长宽(x,y,w,h
    在这里插入图片描述

评价边界框的好坏:交并比(IoU)

交并比IoU)定义了两个矩形框的交集面积并集面积之比,是矩形框重合度的h衡量指标。
在这里插入图片描述

目标检测的基本思路

滑窗

通过固定大小的窗口对整个图像进行滑动遍历,并对窗口中的图像进行评估,以获得评价高的窗口。
为了检测不同大小、不同形状的物体,可以使用不同大小,不同长宽比的窗口扫描图片。
在这里插入图片描述

密集预测基本范式

通过主干网络对对图像提取特征,再由检测头对特征图进行预测,从而减少计算量。
在这里插入图片描述但这种方法对于小目标效果不好,一种解决办法是特征金字塔:
在主干网络卷积的不同层的特征图进行检测头预测,可以有效地对小目标进行预测。

无锚框目标检测算法

无锚框 vs 有锚框

在这里插入图片描述
在这里插入图片描述

FCOS

在这里插入图片描述

YOLO X

在这里插入图片描述

YOLO v8

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值