2018 CVPR
Cascade R-CNN: Delving Into High Quality Object Detection
Cascade R-CNN: High Quality Object Detection and Instance Segmentation
High Quality Object Detection and Instance Segmentation
Introduce
检测=分类+定位

- 确定正样本的过程普遍的做法是:计算anchor box与ground truth 之间的IOU,大于某一个阈值(一般是0.5)就认为这是一个正样本。
阈值低导致 有很多重复的没用的框,可以称为噪声

那检测中的IoU阈值选取高可以吗?
-
越容易得到高质量的样本
-
但是一味选取高阈值会引发两个问题,导致训练出的 detector 效果下降[1]

- 样本减少,引发过拟合 (训练样本通过RPN产⽣的RP与标注所对⽐的IoU直⽅图,当IoU增加时,正样本呈指数级下降。The red numbers are the positive percentage higher than the corresponding IoU threshold.)[1]

- 在train和inference 使用不一样的阈值 ,导致mismatch
即保持训练的阈值较低,只在测试时使⽤⾼阈值,de
- 样本减少,引发过拟合 (训练样本通过RPN产⽣的RP与标注所对⽐的IoU直⽅图,当IoU增加时,正样本呈指数级下降。The red numbers are the positive percentage higher than the corresponding IoU threshold.)[1]

Cascade R-CNN是一种用于提高目标检测和实例分割质量的方法,通过级联多个不同IoU阈值的检测器,解决训练与推断阈值不匹配问题。级联结构在训练和推断时均使用,避免了迭代边界框回归的次优化问题。Cascade Mask R-CNN进一步扩展了这一思想,为每个级联阶段添加分割分支,提升样本多样性,实验结果显示其性能优于Mask R-CNN。
最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



