loss for bounding box

最新推荐文章于 2025-08-05 10:17:11 发布

原创最新推荐文章于 2025-08-05 10:17:11 发布 · 1k 阅读

1 ·

CC 4.0 BY-SA版权

深度学习专栏收录该内容

6 篇文章

订阅专栏

本文详细解析了目标检测算法中用于计算bounding box偏差的各种Loss函数，包括SmoothL1Loss、IoULoss、GIoULoss、DIoULoss和CIoULoss，探讨了它们在回归任务中的应用和优缺点。

概述

本文主要汇总目标检测算法中用于计算bounding box偏差的loss函数。

Smooth L1 Loss

由微软rgb大神于Fast RCNN论文提出该方法

（1）假设 $x$ 为预测框和真实框之间的数值差异，则 $L_{1}$ 、 $L_{2}$ 和 $Smooth_{L_{1}}$ $L o s s$ 定义为：

$L_{1} = \mid x \mid$

$L_{2} = x^2$

$Smooth_{L_{1}}(x) = \begin{cases} 0.5x^2, \qquad if \mid x \mid<1 \\ \mid x \mid - 0.5, othreswise \end{cases}$

（2）3个损失函数对 $x$ 的导数分别为：
$\cfrac{\mathrm{d}L_{1}(x)}{x} = \begin{cases} 1, \qquad if x \geq 0 \\ -1, \quad otherswise \end{cases}$

$\cfrac{\mathrm{d}L_{2}(x)}{x} = 2x$

$\cfrac{\mathrm{d}Smooth_{L_{1}}(x)}{x} = \begin{cases} x, \qquad if \mid x \mid < 1 \\ \pm 1, \quad otherswise \end{cases}$

从损失函数对 $x$ 的导数可知：

$L_{1}$ 损失函数对 $x$ 的导数为常数，在训练后期， $x$ 很小时，如果学习率不变，损失函数会在稳定值附近波动，很难收敛于更高的精度。
$L_{2}$ 损失函数对 $x$ 的导数在 $x$ 很大时，其导数也非常大，在训练初期不稳定。
$Smooth_{L1}$ 完美的避开了 $L_{1}$ 和 $L_{2}$ 的缺点。

（3）实际目标检测回归任务中的loss为：
$L_{loc}(t^u, v) = \sum_{i \in (x,y,w,h)} Smooth_{L_{1}}(t_{i}^u-v_{i})$
其中， $v$ 表示GT的框坐标， $t^u$ 表示预测的框坐标，即分别求4个参数的Loss，然后相加得到Bounding Box Regression Loss。这种方式的前提是假设4个参数是相互独立的，然而4个参数本身是有一定的相关性的。