空间金字塔池化层

这个层放在最后的卷积层和全连接层之间
在conv5层得到的特征图是256层,每层都做一次spatial pyramid pooling。先把每个特征图分割成多个不同尺寸的网格,比如网格分别为4∗4、2∗2、1∗14*4、2*2、1*14∗4、2∗2、1∗1,然后每个网格做max pooling,
这样256层特征图就形成了16∗256,4∗256,1∗25616*256,4*256,1*25616∗256,4∗256,1∗256维特征,他们连起来就形成了一个固定长度的特征向量,将这个向量输入到后面的全连接层。
(注:图里边的d是维的意思,表示单位)