目标检测总结:Cascade RCNN
目标检测中通常用IOU来区分正例和负例,通常IOU取0.5,但通常0.5的IOU阈值会带来大量的噪声,这里的噪声指的是false positive。但是如果增加阈值的选取,检测器的性能并没有提升反而有所下降,其原因在于:1样本减少引起的过拟合,2 train和inference时的阈值不一致带来的mismatch。为了解决iou的问题,作者提出了malti-stage训练的Cascade RCNN算法。
IOU对目标检测的影响
在监测问题中,通常是通过IOU来来判断样本的正负及分类。因此IOU的选取的检测的精度有很大的影响,作者做了几个实验在论证IOU对检测的影响,实验结果如上图所示。
首先,较低的IOU会产生很多的噪声(FP),如figure1(a)所示,当增大IOU的阈值时,噪声减少,如figure1(b)所示。这一点比较直观,很好理解,就是较高的IOU阈值对于噪声有抑制作用,使检测更精确。
另外,如figure1(c)所示,通常来说,经过boxreg之后,新的box的IOU会变得更高,说明detector是有效果的,使得box框更加的精确。另外从图中可以看出,0.55-0.6范围内阈值为0.5的detector性能最好,在0.6-0.75范围内阈值为0.6的detector性能最好,0.75以上的范围内阈值为0.7的detector性能最好。这说明了只有proposal自身的阈值和训练器训练的阈值较为接近的时候,训练器的性能才是最好的。如果两个阈值相隔较远,就是我们之前说的mismatch问题了。
因此,可以确认的是,单一阈值训练出的检测器效果一般,以最常见的0.5阈值为例,由于所有的大于0.5的proposal均被选中,那么对于iou大于0.6的proposal来说,0.5阈值的检测器并不是最优的,那如果把检测器的阈值调到0.7呢,从figure1(d)可以发现,提高阈值的方法并没有提升。原因就在于提升了阈值,