RCNN系列目标检测算法总结（一）

最新推荐文章于 2023-12-04 20:42:08 发布

hai_xiao_tian

最新推荐文章于 2023-12-04 20:42:08 发布

阅读量550

点赞数

本文介绍R-CNN与SPPNet两种目标检测算法。R-CNN通过selectivesearch生成候选区域并利用CNN提取特征，最终采用SVM进行分类；SPPNet则直接对整图进行卷积提取特征，并通过空间金字塔池化获取固定长度的特征向量。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一、R-CNN

1.算法流程：

采用selective search生成region proposal（约2千），由于region proposal尺寸大小不一，需要reshape到227*227。
将每个region proposal 送入CNN网络中提取特征向量。
将提取到的特征向量送入SVM分类器，每个类别对应一个SVM。
对每一类目标，使用一个回归器精修候选框的位置。

2.网络结构

二、SPPNet

1.算法流程：

采用selective search生成region proposal（约2千），
特征提取。将整幅图片输入CNN中，得到feature maps，然后在feature maps上找到原图对应的候选框区域patch，再将此pacth输入到SPP layer，输出固定长度的特征向量。将提取到的特征向量送入SVM分类器，每个类别对应一个SVM。
采用SVM算法对特征向量进行分类识别。

2.SPP layer

黑色图片代表卷积之后的特征图，接着以不同大小的块来提取特征，分别是4*4,2*2,1*1，将这三张网格放到下面这张特征图上，就可以得到16+4+1=21种不同的块（Spatial bins）。从这21个块中，每个块提取出一个最大值，这样得到21*256维特征。这种以不同的的大小各自的组合方式来池化的过程就是空间金字塔池化（SPP）。

3.改进

（1）网络输入的是任意大小的图片

（2）在卷积后的feature map上找对应的候选框，节省大量计算。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。