Spatial Pyramid Pooling net 论文阅读理解笔记
1 动机
常见的用于识别、分类的cnn都要求输入的图像size是固定的,如224*224。因为CNN由卷积层和全连接层两部分组成。卷积层就是一个大小固定的滑动窗在图像上滑动计算窗口覆盖区域的特征,这其实对图像的size是没有要求的,无论输入的size是什么,都可以根据滑动步长和窗口大小生成对应size的输出/feature map。
全连接层需要固定长度的输入,如图,绿色的那一层是前面黄色那一层...
翻译
2019-01-02 11:07:08 ·
351 阅读 ·
0 评论