简介
SPP-net是何凯明团队在rbg大神提出R-CNN之后提出的比较有创新性的网络,其主要贡献在于:
1.打破了CNN网络需要输入固定大小的图像的限制,利用Spatial Pyramid Pooling方法,不需要像以前一样需要对图像进行裁剪等操作,而是直接将entire image输入。
2.利用SPP-Net进行图像分类以及目标检测,虽然对于精度并没有特别明显的提升,但是在object detect中,相比较与rbg大神的R-CNN,检测速度的提升是显著的。
下面对SPP-Net进行简要介绍:
Q1: 为什么CNN网络需要固定大小的输入?
卷积层不需要固定大小的输入,全连接层需要固定大小的输入,因为卷积层类似于滑动窗口,输出的特征图会代表着输入图像的空间特征,但是全连接层是WX+b的线性函数,其输入X与W息息相关,需要维度相同,所以需要固定大小的输入。
Q2:SPP-Net网络是什么样的?
如下图,图1是SPP-Net网络的结构图,图2是SPP Layer的结构图。
根据图1,我们可以很直观的观察到,传统的网络需要首先对图像进行变换,然后送入CNN网络以及全连接层,得到输出结果,而SPP-Net首先将图像输入到CNN网络中,在全连接层之前,进行 Spatial Pyramid Pooling操作,然后再接全连接层,得到输出结果。