目标检测论文阅读:Bridging the Gap Between Anchor-based and Anchor-free Detection via Adaptive Training Sample Selection
论文链接:https://arxiv.org/abs/1912.02424
在https://www.zhihu.com/question/3595的问题下看到了一篇挺有意思的文章,去看了下。这篇paper的cascade r-cnn其实很多地方有点像:都是围绕着iou阈值和采样这方面做了一些文章;本身论述风格也很舒服,先从anchor-based与anchor-free的性能差异来着手。
1. 背景
anchor-based之前介绍过,目前主流有两种,一种是类似corner那种做关键点检测的,另一种则是FCOS那种每个点做一个单独的样本,paper重点讨论的是后者。先看一下retinanet和fcos的结构图:
抛出FCOS的center-ness分支,其实二者非常相似,但从网络来说,唯一的差别就是retinanet最后预测的通道数多了一个A的系数,用来标识每个位置的不同anchor。
那么问题来了,为什么两者性能差异这么大?只是预测方式的不同会产生如此巨大的Gap吗?
2. 实验分析
paper为了做公平的对比,做了