RetinaNet

在目标检测领域,单阶段算法精度第一次超过双阶段,就是RetinaNet。
网络结构:
作者设计的网络结构没有太大创新,文中是这样说的:
The design of our RetinaNet detector shares many similarities with
previous dense detectors, in particular the concept of ‘anchors’
introduced by RPN [3] and use of features pyramids as in SSD [9] and
FPN [4]. We emphasize that our simple detector achieves top results
not based on innovations in network design but due to our novel loss.
检测头是分类与BBox回归解耦的,并且是基于锚框的,经过FPN后输出五层不同尺度的特征图,每层分别对应32~512尺度的锚框,并且每层根据scale和ratios的不同组合有9种锚框,最终整个网络的锚框尺寸是32 ~ 813之间。使用网络预测的相对锚框的偏移量来计算BBox的方法与Faster R-CNN相同。下图是霹雳吧啦的图。

RetinaNet采用FPN生成多尺度特征图,并通过Focal Loss解决单阶段目标检测中正负样本不平衡的问题,提高了小目标检测效果。
最低0.47元/天 解锁文章
2万+

被折叠的 条评论
为什么被折叠?



