FCOS目标检测 paper笔记

最新推荐文章于 2024-12-09 17:38:14 发布

原创

最新推荐文章于 2024-12-09 17:38:14 发布 · 1.1k 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#目标检测 #深度学习 #计算机视觉

本文解析了FCOS目标检测器如何借鉴FCN语义分割框架，避免了anchor-based方法的敏感性和计算负担。介绍其通过密集预测、多层FPN结构和centerness分支来提高精度，以及如何处理重叠框和不同尺度物体。

FCOS：Fully Convolutional One-Stage Object Detection是一个anchor free的detector,
paper链接
 github链接

anchor based检测方法（Faster R-CNN, SSD, YOLO etc.）存在如下问题：
1.detection performance 对anchor box的size ,aspect ratios比较敏感，需要仔细调整超参。
2.超参固定下来以后，如果物体大小变化太大还是适应不了
3.anchor box需要密集拜访，将会有大量的anchor box, 而且它们中的大部分都将是negative sample, 正负样本比例失衡的问题。
4.大量anchor box计算量的增加，比如计算IOU

作者思考是不是可以参考语义分割FCN的框架，一连串直接到底，形式简洁。

DenseBox有做过这方面的改进，用FCN直接得到一个dense map,
output中的每个像素处有一个4D向量，代表左上和右下角的坐标，还有一个class分类。
但是对有overlap的box处理得还不够。
遇到overlap时到底应该属于哪个box？

作者观察到FPN结构可以很大程度解决这个问题，也就是多层feature map.
还提出了改善精度的centerness.

与anchor based的output区别：
anchor based把每个位置当作多个anchor box的中心（不同大小），在这个基础上进一步缩减。
anchor free是在位置上直接regress bounding box.

先定义ground truth的bounding box for input image:
包含左上角和右下角的坐标，class，COCO数据集一共有80类