FCOS:Fully Convolutional One-Stage Object Detection是一个anchor free的detector,
paper链接
github链接
anchor based检测方法(Faster R-CNN, SSD, YOLO etc.)存在如下问题:
1.detection performance 对anchor box的size ,aspect ratios比较敏感,需要仔细调整超参。
2.超参固定下来以后,如果物体大小变化太大还是适应不了
3.anchor box需要密集拜访,将会有大量的anchor box, 而且它们中的大部分都将是negative sample, 正负样本比例失衡的问题。
4.大量anchor box计算量的增加,比如计算IOU
作者思考是不是可以参考语义分割FCN的框架,一连串直接到底,形式简洁。
DenseBox有做过这方面的改进,用FCN直接得到一个dense map,
output中的每个像素处有一个4D向量,代表左上和右下角的坐标,还有一个class分类。
但是对有overlap的box处理得还不够。
遇到overlap时到底应该属于哪个box?
作者观察到FPN结构可以很大程度解决这个问题,也就是多层feature map.
还提出了改善精度的centerness.
与anchor based的output区别:
anchor based把每个位置当作多个anchor box的中心(不同大小),在这个基础上进一步缩减。
anchor free是在位置上直接regress bounding box.
先定义ground truth的bounding box for input image:
包含左上角和右下角的坐标,class,COCO数据集一共有80类

本文解析了FCOS目标检测器如何借鉴FCN语义分割框架,避免了anchor-based方法的敏感性和计算负担。介绍其通过密集预测、多层FPN结构和centerness分支来提高精度,以及如何处理重叠框和不同尺度物体。
最低0.47元/天 解锁文章
1314

被折叠的 条评论
为什么被折叠?



