论文:Scale-Transferrable Object Detection
论文链接:https://pan.baidu.com/s/1i6Yjvpz
Scale-Transferrable Detection Network(STDN)是CVPR2018的文章,用于提高object detection算法对不同scale的object的检测效果。该算法采用DenseNet网络作为特征提取网络(自带高低层特征融合),基于多层特征做预测(类似SSD),并对预测结果做融合得到最终结果。该算法有两个特点:1、主网络采用DenseNet,了解DenseNet的同学应该知道该网络在一个block中,每一层的输入feature map是前面几层的输出feature map做concate后的结果,因此相当于高低层特征做了融合。高低层特征融合其实对object detection算法而言是比较重要的,FPN算法是显式地做了高低层特征融合,而SSD没有,这也是为什么SSD在小目标问题上检测效果不好的原因之一,因此该算法虽然看似SSD,但其实和SSD有区别。2、引入scale-transfer layer,实现了在几乎不增加参数量和计算量的前提下生成大尺寸的feature map(其他常见的算法基本上都是采用deconvolution或upsample),由于scale-transfer layer是一个转换操作,因此基本不会引入额外的参数量和计算量。
Figure1是object detection算法中常用的几种预测层设计方式:(a)是Faster RCNN的做法,显然这种做法所利用的特征层较少,效果一般;(b)是FPN算法的做法,基于融合后的特征做预测对于小目标的检测效果提升更加明显;(c)是SSD算法的做法,虽然也是基于多层特征做预测,但是每个预测分支还是基于单层特征,因此虽然浅层用来预测小目标,但由于浅层没有与富含语义信息的高层做融合,因此对于小目标的检测效果一般;(d)本文的scale transf