【OpenMMLab 实战营打卡-第4课】计算机视觉之目标检测算法基础

原创已于 2023-02-07 13:29:29 修改 · 376 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#计算机视觉 #目标检测 #算法

于 2023-02-07 13:22:54 首次发布

OpenMMLab 专栏收录该内容

14 篇文章

订阅专栏

目标检测是计算机视觉中的关键技术，涉及边界框、滑动窗口和特征图等方法。从YOLO到SSD、RetinaNet，技术不断演进，广泛应用于智慧城市、自动驾驶和文字识别等领域。

部署运行你感兴趣的模型镜像

一、定义

目标检测是指给定一张图片，让计算机程序用矩形框框选出所有感兴趣的物体（定位），同时预测物体的类别（分类）。
在这里插入图片描述

1. 边界框

边界框是指紧密包裹感兴趣物体的矩形框。
在这里插入图片描述

交叉比定义为两个矩形框交集面积占并集面积指标之比，是矩形框重合程度的衡量指标。

置信度是指模型认可自身预测结果的程度。

非极大值抑制

边界框回归

边界框编码

混淆矩阵
在这里插入图片描述
召回率和准确率

PR曲线

二、发展

1. 滑动窗口

滑动窗口属于一种暴力搜索方法，优点是非常直观简单；缺点是当图片尺寸增大和类别增多时，搜索空间呈几何倍增长，对于目标检测算法来说具有不可接受的计算成本。
在这里插入图片描述

2. 特征图滑窗

用卷积一次性计算所有特征，再取出对应位置的特征进行分类，这样无论窗口个数多少，重叠区域都只需要计算一次卷积特征即可。
在这里插入图片描述
密集预测

目标检测分类
目标检测分为单阶段方法和两阶段方法。其中，单阶段方法检测速度相对较快，精度相对较低；两阶段方法检测精度相对较高，检测速度相对较慢。

单阶段目标检测算法
在这里插入图片描述
两阶段目标检测算法

目标检测算技术的更新迭代
在这里插入图片描述

a.YOLO

在这里插入图片描述

b.SSD

在这里插入图片描述

c.RetinaNet

在这里插入图片描述

d.FCOS

在这里插入图片描述

e. DETR

在这里插入图片描述
f. Deformable DETR

三、应用

1. 智慧城市

在智慧城市中目标检测的应用领域主要有：垃圾检测、道路检测、行人检测以及烟雾和火灾检测等。
在这里插入图片描述

2.自动驾驶

在自动驾驶中，目标检测主要应用于对车辆周围道路、车辆、行人以及环境等物体的检测，通过环境感知得到的数据用于指导车辆进行路径规划和运动控制。
在这里插入图片描述

3. 文字处理&姿态估计

目标检测在下游视觉任务中主要有文字识别和姿态估计。
在这里插入图片描述
目标检测和图像分类的区别：

您可能感兴趣的与本文相关的镜像

Yolo-v5

Yolo-v5

Yolo

YOLO（You Only Look Once）是一种流行的物体检测和图像分割模型，由华盛顿大学的Joseph Redmon 和Ali Farhadi 开发。 YOLO 于2015 年推出，因其高速和高精度而广受欢迎

AI算力推荐

Yolo-v5

YOLO（You Only Look Once）是一种流行的物体检测和图像分割模型，由华盛顿大学的Joseph Redmon 和Ali Farhadi 开发。 YOLO 于2015 年推出，因其高速和高精度而广受欢迎

Yolo

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。