R-CNN

本文详细介绍了R-CNN算法,一种基于RegionProposal的物体检测方法,使用CNN提取特征并结合SVM进行分类和回归,包括其工作流程、模块详解和缺陷。R-CNN通过预训练和fine-tune在目标检测领域具有开创性意义。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1 RCNN的简介

CVPR2014经典paper:《Rich feature hierarchies for accurate object
detection and semantic segmentation》,http:// https://arxiv.org/abs/1311.2524
这篇论文的算法思想被称为R- CNN(Regions with Convolutional Neural Network Features)
该算法思想更改了物体检测的总思路,现在很多物体检测算法均基于该算法。
简单来讲: R-CNN是一种基于Region Proposal的CNN网络结构
Region Proposals 是指可能包含目标对象的图像区域的候选集合。换句话说,它们是图像中那些可能包含我们想要检测的对象的区域。在 R-CNN 和类似模型中,这些区域会进一步被处理以确定它们确实包含对象,并且确定对象的类型和位置。
R-CNN算法中采用和传统目标检测类似的执行过程,主要包含以下
几个步骤:
1. 区域提名(Region Proposal):通过区域提名的方法从原始图片中提取2000个左右的区域候选框,一般选择Selective Search(SS);
2. 区域大小归一化:将所有候选框大小缩放固定大小(eg:227*227);
3. 特征提取:通过CNN网络,对每个候选区域框提取高阶特征,将高阶特征保存磁盘;
4. 分类与回归:在高阶特征的基础上添加两个全连接层,再使用SVM分类器来进行识别,用线性回归来微调边框位置与大小,其中每个类别单独训练一个边框回归器(类似OverFeat的class specific结构)。

2 RCNN的模块

上述模块是训练的时候的模块

模块1

在模块一中,使用SS算法来获取2000个区域提案,后续做预处理,全部尺寸改变为227x227,这是 AlexNet 输入尺寸的要求

预处理如下图

模块2 

在模块2中,使用alexnet网络来提取特征,并进行fine-tune微调(为了训练特征提取功能),微调通常指的是在预训练的 CNN 上进行额外训练,以适应新的数据集或任务。这通常涉及到将 CNN 的最后一层(全连接层)替换为新的层,然后在新数据集上继续训练。在训练时,根据 IoU 阈值&#

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值