R-CNN、SPPNet、Fast Rcnn、Faster R-CNN 原理以及区别

本文深入解析R-CNN、SPPNet、FastRCNN及FasterRCNN原理,从SelectiveSearch到RPN网络,逐步提升目标检测速度与精度,是理解现代目标检测技术不可或缺的指南。

R-CNN原理:
  R-CNN遵循传统目标检测的思路,同样采取提取框,对每个框提取特征,图像分类,非极大值抑制等四个步骤,只不过在提取特征这一步将传统的特征换成了深度卷积网络提取的特征。
 对于原始图像, 首先使用Selective Search 搜寻可能存在物体的区域。Selective Search 可以从图像中启发式地搜索出可能包含物体的区域。相比穷举而言, Selective Search 可以减少一部分计算量。下一步,将取出的可能含高物体的区域送入CNN 中提取特征。CNN 通常是接受一个固定大小的图像,而取出的区域大小却各有不同。对此, R-CNN的做法是将区域缩放到统一大小, 再使用CNN提取特征。提取出特征后使用SVM 进行分类,最后通过非极大值抑制抑制输出结果。
R-CNN的过程可以分为四步:
 在数据集上训练CNN 。R-CNN 论文中使用的CNN 网络是AlexNet 1,数据集为ImageNet 。
  在目标检测的数据集上,对训练好的CNN做微调 。
 用Selective Search 搜索候选区域,统一使用微调后的CNN对这些区域提取特征,并将提取到的特征存储起来。
 使用存储起来的特征,训练SVM 分类器。

SPPNet原理
 SPPNet原理就是利用ROI池化层将CNN的输入从固定尺寸改为任意尺寸,通过最大池化层,可以将任意宽度的、高度的卷积特征转换成固定长度的向量,原始图像中的候选框,实际也可以对应到卷积特征中相同位置的框。利用ROI池化层可以将不同形状的特征对应到相同长度的向量特征。与R-CNN相比比,SPPNet具有更快的速度。

Fast RCNN原理
 Fast RCNN与SPPNet相比,不再使用SVM分类,而是利用神经网络分类,直接使用全连接层,全连接层有两个输出,一个负责分类,另一个负责框回归。同一个网络完成提取特征、判断类别、框回归三项工作。

Faster RCNN原理
 与Fast RCNN相比,Faster RCNN用RPN网络代替了Select

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值