RCNN系列目标检测算法总结(一)

本文介绍R-CNN与SPPNet两种目标检测算法。R-CNN通过selectivesearch生成候选区域并利用CNN提取特征,最终采用SVM进行分类;SPPNet则直接对整图进行卷积提取特征,并通过空间金字塔池化获取固定长度的特征向量。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、R-CNN

1.算法流程:

  • 采用selective search生成region proposal(约2千),由于region proposal尺寸大小不一,需要reshape到227*227。
  • 将每个region proposal 送入CNN网络中提取特征向量。
  • 将提取到的特征向量送入SVM分类器,每个类别对应一个SVM。
  • 对每一类目标,使用一个回归器精修候选框的位置。

2.网络结构

二、SPPNet

1.算法流程:


  • 采用selective search生成region proposal(约2千),
  • 特征提取。将整幅图片输入CNN中,得到feature maps,然后在feature maps上找到原图对应的候选框区域patch,再将此pacth输入到SPP layer,输出固定长度的特征向量。将提取到的特征向量送入SVM分类器,每个类别对应一个SVM。
  • 采用SVM算法对特征向量进行分类识别。


2.SPP layer


        黑色图片代表卷积之后的特征图,接着以不同大小的块来提取特征,分别是4*4,2*2,1*1,将这三张网格放到下面这张特征图上,就可以得到16+4+1=21种不同的块(Spatial bins)。从这21个块中,每个块提取出一个最大值,这样得到21*256维特征。这种以不同的的大小各自的组合方式来池化的过程就是空间金字塔池化(SPP)。

3.改进

(1)网络输入的是任意大小的图片

(2)在卷积后的feature map上找对应的候选框,节省大量计算。





    




    

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值