广义相交:边界框回归损失度量(解读)(原论文)
IoU不能作为损失函数的原因:
IoU在边界框与坐标轴对齐的情况下,可以用作回归损失。但是存在一种情况,当预测框与真实框不重叠的情况下,用IoU作为损失函数是不可行的。因为IoU是预测框A与真实框B的交并比,即IoU=|A∩B| / |A∪B|,如果预测框与真实框不重叠,那么A∩B=0,则IoU=0。此时继续进行迭代,剃度为0,不能优化参数,该损失函数完全失去了作用。
IoU的另一个缺点:
如上图,IoU不能区分两种物体的不同排列方式。对于两个对象在几个不同方向上的重叠,他们都具有相同的交集水平,IoU的值完全相等。因此IoU不能表示两对象之间如何发生的重叠。
GIoU要解决的问题:
GIoU想要解决IoU的以上两个缺点,并保证具有与IoU相同的一些属性:
- 遵循与IOU相同的定义,即将比较对象的形状属性编码到区域属性中。
- 保持IOU的尺度内插即用性质。
- 确保在重叠对象的情况下与IoU有很强的相关性。
文章主要工作:
GIoU能够在边界框与坐标轴对齐的情况下,作为损失使用。
- 提出GIoU最为比较两种任意形状的新指标。
- 提供了一种分析解决方案,用于将GIoU用作两个轴对齐矩形或一般n-正交。
- 将GIoU损失方入最流行的物体检测算法,如更快的R-CNN,Mask R-CNN和YOLO v3,并展示其在标准物体检测方面的性能改进。
部分研究现状:
- IoU作为评估标准时,必须选择精度阈值。然而,任意选择阈值,不能充分反映不同方法的定位性能。任何高于阈值的定位精度都应该被同等对待,以使这一性能指标对IoU阈值的选择不那么敏感。MS COCO基准挑战赛中,出现了跨越多个IoU阈值平均值的mAP。
- YOLO v1中提出了对边界框参数的直接回归,并用一个小的调整来预测边界框大小的平方根以弥补尺度灵敏度。
- 在R-CNN中通过预测来自使用选择性搜索算法计算的先前边界框的位置和大小偏移来参数化边界框表示。 为了减轻表示的缩放灵敏度,在日志空间中定义边界框大小偏移。然后,使用“
”(也称为MSE损失)作为优化目标。
GIOU计算方式:
对于两个任意矩形A,B,我们首先找到包含A和B的最小边界框矩形C。然后我们计算除A和B之外的C占据的面积除以C占据的总面积之间的比率。这表示A和B之间的空面积的归一化度量。 最后,通过从IoU值中减去该比率来获得GIoU。
图中C\(A∪B)表示除A和B之外的C占据的面积。
GIOU属性:
- 类似于IoU,GIoU是一个距。例如
,包含度量的所有属性,如非负性,不可分辨性,对称性和三角不等式。
- 与IoU类似,GIoU对问题的规模具有不变性。
- GIoU始终是IoU的下限,即GIoU(A,B)≤IoU(A,B),当A和B具有更强的形状相似性和接近度时,该下限变得更紧密,即
。
- 0 ≤ IoU(A, B) ≤ 1。但是GIoU为对称范围, −1 ≤ GIoU(A, B) ≤ 1。
- 当两个对象完美覆盖时,值才为1,即GIoU = IoU = 1
- 当两种形状 |A∪B| 于边界框 |C| 的面积的占位比为 0 时,GIoU渐进收敛于 -1,
5.与IoU相比,GIoU不仅关注重叠区域。 当A和B相对于彼此没有很好地对准时,封闭形状C中的两个对称形状A和B之间的空白空间增加。 因此,GIoU的值可以更好地反映两个对称物体之间如何发生重叠。
实验验证:
文章中,将GIoU分别用于Faster R-CNN, Mask R-CNN and YOLO v3算法中,并在PASCAL VOC 2007和MS COCO数据集上验证其有效性。