讨论分类模型和检测模型各自特点,设计了一个适合检测任务的新的骨干网络。
一、摘要
很多检测模型都是在分类模型的基础上演变的,基本都是在ImageNet预训练模型上进行finetune的。图像分类任务和目标检测任务之间有着如下的差别:(1)最新的检测模型如FPN和RetinaNet通常会涉及与图像分类任务以外的阶段,来处理多尺度的物体;(2)物体检测不仅需要知道物体的类别还需要获取对应的坐标位置。大的下采样因子会获得大的感受野,这对于图像分类是有利的,但是破坏了物体的位置。由于图像分类和物体检测之间的差异,我们设计了用于物体检测的新backbone网络DetNet。DetNet包含了与传统分类基网络不同的特殊阶段,可以在深层网络中维持高空间分辨率。
二、贡献
1、细节信息
指出使用分类骨干网络进行目标检测存在以下两个问题:网络来进行检测存在以下两个问题:(1)现阶段的检测器存在与分类骨干网络不同的特别状态,如FPN,用来多尺度的检测。(2)传统的分类骨干网络通过大的下采样因子来获得高的感受野,这对于分类时有用的,但是对于大的物体的定位和小物体的识别却是不利的。
为了解决以上两个问题,提出了一种新的backbone——DetNet。
DetNet的特征:(1)包含类似FPN一样的stage,实现多尺度检测;(2)即使通过特征的提取,也能保持特征的空间分辨率。
2、贡献总结如下:
(1)第一个分析现阶段使用传统ImageNet预训练模型类微调检测器的固有弊端;
(2)提出一个新的backbone,称为DetNet,可以保持空间分辨率的同时维持大的感受野。
三、为目标检测设计的骨干网络——DetNet
1、动机
现阶段目标检测常用的骨干网络是通过分类网络变化得到的,存在以下三个问题:
(1)不同的骨干网络的网络阶段数目是不一样的。
(2)对大的物体有低的可见度——深层网络大物体的边界变模糊
由于降采样因子的存在,大的步长对于物体定位是有害的。例如在物体检测中,大的物体是在深层网络中进行预测的,在这些深层网络中物体的边界变得模糊以致不能得到很好地回归。
(3)对小的物体的不可见—