Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression
作者:Hamid Rezatofighi, Nathan Tsoi, JunYoung Gwak, Amir Sadeghian, Ian Reid, Silvio Savarese
论文链接:https://arxiv.org/abs/1902.09630
论文解读:https://mp.weixin.qq.com/s/6QsyYtEVjavoLfU_lQF1pw
重点:包围框boundingbox优化方法
1、零碎的笔记
我首先看的是论文解读连接里面的讲解,截图来自极市平台的解读。
1)bounding box regression中L1、L2 loss这个可以提升的点。
2)IoU是目标检测中一个重要的概念,在anchor-based的方法中,他的作用不仅用来确定正样本和负样本,还可以用来评价输出框(predict box)和ground-truth的距离,或者说predict box的准确性。IoU有一个好的特性就是对尺度不敏感(scale invariant)。
3)loss和IoU对比
4)IoU也有问题,所以要用GIou
5)GIoU
疑问:这里不是很看得懂是什么意思,上下约分一下不就变成了,1/|AUB|了吗。
而且不是很董C是什么,smallest enclosing convex object,最小封闭凸体。
6)GIoU和IoU作为loss的计算方法
上一个疑问在这里找到了答案:
从这个算法我们回看上面的GIoU截图,最后的使用不太准确,应该是|C-(AUB)|/|C|
然后C这个最小封闭凸体,就是最小外切矩形,解读里面将之翻译成最小闭包区域
这个闭包虽然在这个代码里面,因为用的是矩形的boundingbox,所以是最小外切矩形
考虑引申,使用在多边形的mask计算中的时候,应该使用凸包来计算。
7)实验效果
纵向的MSE是YOLO的原始loss,然后对比LIOU和LGIOU,三行是三个loss比较
AP是Average Precision,目标检测(Object Detection)中性能衡量指标
参考:https://blog.youkuaiyun.com/asasasaababab/article/details/79994920