基于DL的目标检测技术:R-CNN、Fast R-CNN、Faster R-CNN

本文详细介绍了基于深度学习的目标检测技术,包括R-CNN、Fast R-CNN和Faster R-CNN。R-CNN通过选择性搜索获取候选框并使用CNN特征,SVM分类及回归器进行物体检测。Fast R-CNN引入SPP Net减少重复计算,但仍依赖选择性搜索。Faster R-CNN提出RPN网络,有效替代选择性搜索,显著提升检测速度。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

目标检测:在给定的图片中精确找到物体所在位置,并标注出物体的类别。
目标检测=图像识别(CNN)+定位(回归问题/取图像窗口)

遇到多物体识别+定位多个物体?
选择性搜索找出可能含有物体的框(候选框)判定得分。这些框之间是可以互相重叠互相包含的,从而避免暴力枚举的所有框了。

1.R-CNN

步骤一:训练(或者下载)一个分类模型(比如AlexNet)
步骤二:对该模型做fine-tuning

  • 修改分类数
  • 去掉最后一个全连接层

步骤三:特征提取

  • 提取图像的所有候选框(选择性搜索)
  • 对于每一个区域:修正区域大小以适合CNN的输入,做一次前向运算,将第五个池化层的输出(就是对候选框提取到的特征)存到硬盘
    在这里插入图片描述

步骤四:训练一个SVM分类器(二分类)来判断这个候选框里物体的类别

  • 每个类别对应一个SVM,判断是不是属于这个类别,是就是正类,反之负类

步骤五:训练一个回归器精细修正候选框位置:对于每一个类,训练一个线性回归模型去判定这个框是否框得完美。
在这里插入图片描述

速度瓶颈

计算机对所有候选框进行特征提取时会有重复计算

2.Fast R-CNN

在RCNN的基础上采纳了SPP Net方法(空间金字塔池化)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值