【FCOS】:Fully Convolution One-Stage Object Detection

最新推荐文章于 2024-05-22 18:16:22 发布

原创最新推荐文章于 2024-05-22 18:16:22 发布 · 326 阅读

0 ·

CC 4.0 BY-SA版权

论文阅读专栏收录该内容

37 篇文章

订阅专栏

本文介绍了One-stage anchor-free目标检测方法FCOS。它通过回归center到四边的边距进行检测，因该方法出现低质量预测框，采用“center-ness”处理。其比肩anchor-based方法，还可用于二阶段RPN提升效果。文中阐述了回归目标、Loss函数、多尺度预测及Center-ness等细节。

在这里插入图片描述
2019年anchor-free的论文

code

文章目录

概述

要解决的问题
- One-stage anchor-free object detection
采用的方法
- center到top, left,right, bottom边距的回归
- 由于采用了上述方法，出现了一些低质量的预测框，使用了“center-ness”方法来处理
结果如何
- 比肩anchor-based一类的方法
- one-stage state-of-the-art
- FCOS的方法可以用作二阶段的RPN部分，效果提升
相关
- 之前有过FCN-based的框架来做检测：DenseBox(2015), UnitBox(2017)。
- 这些FCN-based的方法呢，都是直接在每个spatial location上进行预测(4D vector & 1-D cls)
- anchor-based：来源于对于滑动窗口的考虑，如Fast R-CNN，Faster R-CNN, SSD,
- anchor-free：most popular anchor-free detector might be YOLOv1，v2以及以上就使用了anchor，CornerNet，

细节

1、Fully Convolution One-Stage Object Detector
- regression target： $t^*=(l^*, t^*, r^*,b^*)$ ，这里的四个 $l^*, t^*, r^*,b^*$ 分别表示的是location到bbox四个边的距离
- 如果location落在了多个bbox里，那么认为这是一个“模糊样本”，选择小的bbox作为这个location预测样本的target
- Loss函数（网络输出）
  $L({P_{x,y}, {t_{x,y}}})=\frac{1}{N_{pos}}\sum{L_{cls}(P_{x,y}, c^*_{x,y}) + \frac{\lambda}{N_{pos}}\sum{1_{c^*_{x,y}>0}}L_{reg}(t_{x,y}, t^*_{x,y})}$
  
  前面的分类损失函数是focal loss，回归损失则是IOU loss， ${N_{pos}}$ 表示的是正样本的数量
2、Multi-level Prediction with FPN for FCOS
正负样本
{ $P_3,P_4,P_5,P_6,P_7$ }特征层，分别对应的stride是8，16，32，64，128，在此处做一个限制，对于第 $i$ 层的数据我们要满足 ${max(l^*,r^*,t^*,b^*)}>m_i$ 或者满足 ${max(l^*,r^*,t^*,b^*)}<m_{i-1}$ ，那么这个location的预测框设为负样本。那么 $m_2, m_3, m_4, m_5, m_6, m_7$ 设置为0, 64, 128, 256, 512, $\infty$

在这里插入图片描述

3、Center-ness for FCOS
motivation: 许多低质量的预测框（远离目标的中心）
所以增加了一个branch来预测每个location的center-ness，表示的是某一个location距离目标中心的距离。对应的target如下：

$centerness^*=\sqrt{\frac{min(l^*, r^*)}{max(l^*,r^*)}*\frac{min(t^*, b^*)}{max(t^*, b^*)}}$