该论文为one-stage目标检测。是以RetinaNet为基础,增加了FRM(feature refinement module)以及设计了一个可导的近似偏斜损失函数(approximate SkewIoU),目的为了解决目标检测的三大挑战:1.大纵横比目标,2.密集目标的图像,3.任意旋转目标的图像。针对不同的场景做出相对应的解决方案。
网络结构

该论文是在RetinaNet的基础上进行增加新的模块和改变损失函数设计而成的,每层FPN连接着分类子网(class subnet)和边界盒回归子网(box subnet)以及FRM(feature refinement module)。
1.分类子网(class subnet)
FPN的每层都都连接着两个分类子网,第一个分类子网是直接接收FPN层输入的feature map,第二个分类子网接收的是FRM处理过后的feature map。
2.边界盒回归子网(box regression subnet)
与分类子网相同。
3.FRM(feature refinement module)
FRM同时接收第一个分类回归子网的特征和FPN层输入的特征,将这两个特征进行堆叠然后进行卷积操作输入到第二个分类回归子网。
4.anchor的设计
在FPN的p3~p7层对应着面积为~
的anchor,并且每层使用长宽比例为{1, 1/2, 2, 1/3, 3,

R3Det是一种基于RetinaNet的一阶段目标检测方法,通过引入特征细化模块(FRM)及近似偏斜损失函数,有效解决了大纵横比、密集及旋转目标的检测难题。在多个数据集上的实验证明了其优越性。
最低0.47元/天 解锁文章
1050





