[论文笔记] Generalized Intersection over Union
一,大纲
包围框回归是2D/3D 视觉任务中一个最基础的模块,不管是目标检测,目标跟踪,还是实例分割,都依赖于对bounding box进行回归,以获得准确的定位效果。目前基于深度学习的方法想获得更好的检测性能,要么是用更好的backbone,要么是设计更好的策略提取更好的feature,然而却忽视了bounding box regression中L1、L2 loss这个可以提升的点。
而在该篇论文中,作者先表明了常用的Ln LOSS没法很好地体现出regression的效果,然后分析了直接使用IOU指标(判断predict box和gt的距离的最直接的指标)作为损失函数的利弊,然后提出了改进指标GIOU并用GIoU loss替换掉了大多数目标检测算法中bounding box regression loss,最后接用实验结果证明了GIOU的优越性。
二,Ln LOSS的不足
首先,IoU是目标检测中最常用的评估尺度,它是一种比值的概念&#x