论文链接: Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression
背景&问题:
IoU是目标检测领域用来衡量目标是否精确定位的指标。我们用L1、L2 loss回归得到bbox,计算IoU。但是目前的方案存在如下问题:
-
L1 L2 Loss不能准确度量IoU是否回归正确:不同IOU对应相同的L1/L2 Loss

-
IoU对旋转不敏感(垂直图像投影平面的旋转)
-
IoU对det和gt检测框不重合的情况无法优化
解决方案:使用广义的IoU,即GIoU:
A 、 B 是 我 们 的 d e t 和 g t 的 b b o x , C 是 他 们 的 矩 形 闭 包 A、B是我们的det和gt的bbox,C是他们的矩形闭包 A、B是我们的det和gt的bbox,C是他们的矩形闭包
G I o U = I o U − ∣ C ( A ∪ B ) ∣ ∣ C ∣ GIoU = IoU - \frac{|C\\(A \cup B)|}{|C|} GIoU=IoU−∣C∣∣C(A∪B)∣
L G I o U = 1 − G I o U L_{GIoU} = 1 - GIoU LGIoU=1−GIoU
GIoU优势
- 保留IoU的特性
- 对解决垂直图像投影平面的旋转不敏感问题

效果
-
YOLOv3

-
Faster-RCNN

-
MaskRCNN

展望
还有一些问题
- 其他方向处理不了,比如警察绕原地转圈
本文探讨了目标检测领域中IoU的局限性,包括L1/L2Loss对IoU回归的不准确度量及对旋转的不敏感等问题。提出了一种新的指标——广义IoU(GIoU),并详细介绍了其计算方式和优势,如保留IoU特性,改善旋转不敏感问题。同时,展示了GIoU在YOLOv3、Faster-RCNN和MaskRCNN等模型上的应用效果。
1万+

被折叠的 条评论
为什么被折叠?



