&Title:
- Cascade R-CNN: Delving into High Quality Object Detection
- Cascade R-CNN: Delving into High Quality Object Detection(中文翻译)
&Summary
本篇文章主要解决了在目标检测中,检测框不是特别准,容易出现噪声干扰的问题,即close false positive,为什么会有这个问题呢?
作者实验发现,因为在基于anchor的检测方法中,我们一般会设置训练的正负样本(用于训练分类以及对正样本进行坐标回归),选取正负样本的方式主要利用候选框与ground truth的IOU占比,常用的比例是50%,即IOU>0.5的作为正样本,IOU<0.3作为负样本等,但是这样就带来了一个问题,阈值取0.5是最好的吗?
作者通过实验发现,
- 设置不同阈值,阈值越高,其网络对准确度较高的候选框的作用效果越好。
- 不论阈值设置多少,训练后的网络对输入的proposal都有一定的优化作用。
基于这两点,作者设计了Cascade R-CNN网络,如下面图Figure3(d)所示,即通过级联的R-CNN网络,每个级联的R-CNN设置不同的IOU阈值,这样每个网络输出的准确度提升一点,用作下一个更高精度的网络的输入,逐步将网络输出的准确度进一步提高。
一句话总结就是:Cascade R-CNN就是使用不同的IOU阈值,训练了多个级联的检测器。
&Research Objective
本文主要针对的是检测问题中的IoU阈值选取问题
&Problem Statement
目标检测其实主要干的就是两件事,一是对目标分类,二是标出目标位置。所以,为了实现这两个目标,在训练的时候,我们一般会首先提取候选proposal,然后对proposal进