空间金字塔池化网络SPP-Net

SPP-Net通过空间金字塔池层解决了CNN对固定输入大小的依赖,增强了对任意比例图像的识别能力。它在目标检测中提升效率,通过单尺度和多尺度训练方法改善精度。论文介绍了网络结构、池化策略以及在R-CNN中的应用实例。

0x01概要介绍

现有的深卷积神经网络(CNNs)需要一个固定大小(如224×224)的输入图像。这种要求是“人为的”,可能会降低对任意大小/比例的图像或子图像的识别精度。在这项工作中,我们为网络配备了另一种池策略“空间金字塔池”,以消除上述要求。这种新的网络结构称为SPP网,它可以生成一个固定长度的表示,而不考虑图像的大小/比例。金字塔池对对象变形也很健壮。有了这些优势,SPP网应该在总体上改进所有基于CNN的图像分类方法。

SPP-net使用单一的完整图像表示而不是精细的方法实现了最先进的分类结果-调音SPP网络的强大功能在目标检测中也很重要。利用SPP网络,我们只需计算一次来自整个图像的特征映射,然后将任意区域(子图像)的特征集合起来生成固定长度的表示,以训练检测器。该方法避免了重复计算卷积特征。在处理测试图像时,我们的方法比R-CNN方法快24-102倍

引出SPP-Net的原因:
在cnn的训练和测试中存在一个技术问题:目前流行的CNNs要求输入图像大小固定(如224×224),这既限制了输入的纵横比,也限制了输入的规模图像。什么时候对于任意大小的图像,当前的方法大多是将输入图像调整为固定大小,通过裁剪或通过翘曲,如图所示。但是裁剪区域可能不包含整个对象,而扭曲的内容可能会导致不需要的几何图形扭曲。识别由于内容丢失或失真,精度可能会受到影响。

在这里插入图片描述
为什么需要固定尺寸?

cnn主要由两部分组成:卷积层和随后的完全连接层。卷积层以滑动窗口方式操作,并输出表示激活的空间排列的特征图(图2)。事实上,旋转层不需要固定的图像大小,可以生成任何尺寸的特征图。另一方面,完全连接的层需要有固定大小/长度的定义输入。因此,固定大小约束仅来自完全连接层.

输入本文引入空间金字塔池(SPP)来取消网络

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值