文章目录
最近看了一下Object Detection在Scale问题上的发展,本文将介绍下面四篇论文
Feature Pyramid Networks for Object Detection
An Analysis of Scale Invariance in Object Detection – SNIP
SNIPER: Efficient Multi-Scale Training
Scale-Aware Trident Networks for Object Detection
FPN:Feature Pyramid Networks for Object Detection
该文章可以说是提出了目前使用最广泛的解决Scale的方法,该方法最主要的贡献在于将解决Scale的问题的方法从Image Pyramid变成了Feature Pyramid,Feature Pyramid的优势在于计算速度快,原因在于不用在不同Scale的图片上多次做检测,共用了同一个特征金字塔。
对于这篇文章,其精髓就在于下图
- a图:Image Pyramid,图像金字塔,传统CV中主要使用的方法,在不同尺度的图片中构建特征从而使得特征拥有Scale Invariance的特性。但用于神经网络中,对于(a)图,就得训练4个Detector来对4个Scale的图片进行检测。这样子网络网络大,而且计算量大。
- b图:Single Scale,图像分类使用的模型。在该模型上做Object Detection,没有对不同Scale的物体做区分。
- c图:使用了特征金字塔,但由于下面几层的特征提取不够充分,感受野小的问题,使用下面几层的特征做Detection效果会受限制,SSD就是使用这种结构。
- d图:Feature Pyramid,特征金字塔,解决了©图中的问题,使得下面几层的feature map在保持高分辨率的同时也有semantic的信息。
在不同的Stride上的feature map上做Detection,对