RCNN

R-CNN是一种基于选择性搜索的区域建议方法,它使用CNN提取特征并结合SVM进行目标分类和边界框回归,以实现目标检测。通过预训练的AlexNet进行特征提取,然后针对每个类别训练SVM分类器和回归器。测试阶段,通过SVM打分和非极大值抑制确定最终检测结果。尽管R-CNN提高了目标检测的准确性,但其计算效率较低。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

这里写自定义目录标题

目录

R-CNN

自从Alexnet获得2012年 ILSVRC 2012冠军后,用CNN进行分类成为主流。原始的用于目标检测的暴力方法是从左到右,从上到下滑动窗口,利用分类识别目标。为了在不同观察距离处检测不同的目标类型,需要使用不同大小和宽高比的窗口。

  1. R-CNN提出了选择性搜索,用候选区域方法创建目标检测的ROI。首先将每个像素作为一组,然后计算每组的纹理,并将两个最接近的组结合起来,继续合并区域,直到所有区域都结合在一起。这样可以减少一部分计算量。
  2. 下一步取出可能含有目标的ROI送入CNN中提取特征。因为CNN通常是接收一个固定大小的图像,而取出的区域通常大小不一样,因此需要对这些区域进行统一缩放到一定的大小,再使用CNN提取特征
  3. 提取的特征再使用SVM进行分类,最后通过非极大值抑制输出结果

R-CNN基本结构

在这里插入图片描述

训练的数据库:
一个较大的识别库 (Imagenet ILSVC 2012)有1000个类别 一千万张图像 用于预训练
一个较小的检测库(PASCAL VOC 2007)20个类别 1万张图像 用于调优参数

训练步骤:
一:对VOC 2007数据集中所有图像采用selective search方式获取region proposal ,每个图像大约得到2000个region proposal
二:准备正负样本。如果region proposal与ground truth的IOU大于等于0.5,则为正样本,否则为负样本。ground truth 也为正样本。
三:预训练。采用AlexNet学习特征,包含5个卷积层和两个全连接层

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值