- 代码:https://github.com/Gus-Guo/AugFPN
- 论文:https://arxiv.org/abs/1912.05384
摘要
- 现有的SOTA检测器都使用了构建特征金字塔(不同尺度的特征组合),来提升对不同尺度(大小)的目标的检测鲁棒性。而FPN是其中的代表性工作
- 本文对FPN进行了分析,找到了其中的一些设计上的缺陷
- 针对缺陷提出了3个改进点,也正是AugFPN的3个组成部分:
- Consistent Supervision:用于降低不同scale之间的语义Gap
- Residual Feature Augmentation:用于在不同尺度的特征融合(fusion, summation)中降低信息损失
- Soft RoI Selection:更好地从图像金字塔中取出ROI Feature用于分类
- 将FasterRCNN中的FPN结构改成AugFPN,在ResNet50和MobileNet-v2上都有mAP提升
- 另外,AugFPN中与特征金字塔相关的改进点(也就是Consistent Supervision & Residual Feature Augmentation),在一些Anchor Based/ Anchor Free的One-stage方法中,也能获得提升
原生的FPN中存在的缺陷分析
针对FPN中对不同尺度特征的融合&利用,Figure 1对其进行了总结。对于一个Backbone,FPN首先会引出它在不同尺度下的输出,这些输出有这样的特性:
- 底层特征尺度(大小