一、定义
目标检测是指给定一张图片,让计算机程序用矩形框框选出所有感兴趣的物体(定位),同时预测物体的类别(分类)。

1. 边界框
边界框是指紧密包裹感兴趣物体的矩形框。


交叉比定义为两个矩形框交集面积占并集面积指标之比,是矩形框重合程度的衡量指标。

置信度是指模型认可自身预测结果的程度。

非极大值抑制

边界框回归

边界框编码

混淆矩阵

召回率和准确率

PR曲线

二、发展
1. 滑动窗口
滑动窗口属于一种暴力搜索方法,优点是非常直观简单;缺点是当图片尺寸增大和类别增多时,搜索空间呈几何倍增长,对于目标检测算法来说具有不可接受的计算成本。


2. 特征图滑窗
用卷积一次性计算所有特征,再取出对应位置的特征进行分类,这样无论窗口个数多少,重叠区域都只需要计算一次卷积特征即可。

密集预测

目标检测分类
目标检测分为单阶段方法和两阶段方法。其中,单阶段方法检测速度相对较快,精度相对较低;两阶段方法检测精度相对较高,检测速度相对较慢。

单阶段目标检测算法

两阶段目标检测算法

目标检测算技术的更新迭代


a.YOLO

b.SSD

c.RetinaNet

d.FCOS

e. DETR

f. Deformable DETR

三、应用
1. 智慧城市
在智慧城市中目标检测的应用领域主要有:垃圾检测、道路检测、行人检测以及烟雾和火灾检测等。

2.自动驾驶
在自动驾驶中,目标检测主要应用于对车辆周围道路、车辆、行人以及环境等物体的检测,通过环境感知得到的数据用于指导车辆进行路径规划和运动控制。

3. 文字处理&姿态估计
目标检测在下游视觉任务中主要有文字识别和姿态估计。

目标检测和图像分类的区别:

目标检测是计算机视觉中的关键技术,涉及边界框、滑动窗口和特征图等方法。从YOLO到SSD、RetinaNet,技术不断演进,广泛应用于智慧城市、自动驾驶和文字识别等领域。
690

被折叠的 条评论
为什么被折叠?



