一、论文解决的问题
特征金字塔(Feature pyramids)是多尺度目标检测系统中一个基础的组成部分,近几年,考虑到特征金字塔影响模型计算速度、占用内存,大多数深度网络避免使用这个结构,SSD模型提出了一个“内置的”特征金字塔解决了上面问题。但是SSD网络只采用自底向上的路径不够完美,除外,SSD舍弃了高分辨率的底层网络层,对小目标的检测不够理想,作者提出了基于Bottom-up pathway、Top-down pathway and lateral connections策略的Feature Pyramid Network (FPN)结构,用于目标检测,取得了不错的效果。
二、几种经典特征抽取方法对比
图(a)核心的思想是利用image pyramid去构建feature pyramid,通过借助SIFT、HOG等传统特征提取算法对不同尺度的图像提取特征。这种方法被广泛使用过一段时间,比如经典的Deformable Part Model算法(DPM)。
图(b)是CNN的框架,相对于a的方法,CNN对图像的表达能力更强,能够通过卷积层的叠加学习到语义特征,除此之外,还有鲁棒性好等优点。但是遇到多尺度目标检测时,CNN的效果不是很理想,需要使用图像金字塔结构。
图(c)是SSD的框架,SSD网络框架是目标检测领域一个经典的模型,不同于主流的目标检测模型,SSD使用CNN金字塔的层级特征。因为CNN是自底向上的对图像做卷积和池化计算,一般情况下,