DIoU

最新推荐文章于 2025-03-27 16:02:55 发布

xiaochengJF

最新推荐文章于 2025-03-27 16:02:55 发布

阅读量491

点赞数

分类专栏：目标检测文章标签：深度学习计算机视觉卷积神经网络目标检测

本文链接：https://blog.youkuaiyun.com/weixin_43711554/article/details/108903854

版权

目标检测专栏收录该内容

41 篇文章

订阅专栏

本文解析了Distance-IoU Loss在2019年论文中的贡献，包括其改进了IoU和GIoU，考虑了中心距离并加速收敛，尤其在处理包含关系时展现出优势。实验对比了不同损失函数在回归过程中的表现，并介绍了DIoU-NMS在解决遮挡NMS问题的应用。关键概念如LIoU, LGIoU, LDIoU和CIoU也被详细解释。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

论文：Distance-IoU Loss: Faster and Better Learning for Bounding Box Regression（2019）
代码：Zzh-tju/DIoU-darknet

文章目录

DIoU

DIoU Loss 具备 GIoU Loss 优势的同时：

考虑与目标中心距离，收敛更快
在被预测框包含的情况下，GIoU Loss基本退化为 IoU Loss，DIoU Loss 仍能发挥较大优势，如下图所示，根据 DIoU Loss 可以认为右侧预测框相对较好，这也符合直观感受
可作为 NMS 评价指标

GIoU 和 DIoU 效果

在这里插入图片描述
$\begin{aligned} \mathcal{L}_{I o U}&= 1-\frac{\left|B \cap B^{g t}\right|}{\left|B \cup B^{g t}\right|} \\ \mathcal{L}_{G I o U} &=1-I o U+\frac{\left|C-B \cup B^{g t}\right|}{|C|} \\ \mathcal{L}_{D I o U} &=1-I o U+\underbrace{\frac{\rho^{2}\left(\mathbf{b}, \mathbf{b}^{g t}\right)}{c^{2}}}_{\mathcal{R}_{DIoU}} \end{aligned}$

其中 $b$ 表示框的中心点， $c$ 表示包含两框（预测框和目标框）的最小矩形的对角线长度， $\rho$ 表示取欧氏距离，除以 $c^2$ 是为了减小目标尺度的影响

在这里插入图片描述

CIoU

考虑框的长宽比， $v$ 表示长宽比的相似性， $\alpha$ 为权重函数
在这里插入图片描述

设置仿真实验比较 IoU、GIoU、DIoU、CIoU 损失，蓝色点为 Anchors 的位置，每个位置有七个尺寸的 Anchor Boxes，中间黑点位置有七个不同尺寸的目标框，对 Anchor Boxes 进行迭代回归， IoU、GIoU、DIoU、CIoU 四种 Loss 表现如下图：

IoU误差曲线：IoU无法横衡量与目标框没有重叠的 Anchor Boxes，离中心较远的 Anchor Boxes 基本训练不到，所以保持较高误差
GIoU误差曲：对于与目标框没有重叠的 Anchor Boxes，GIoU 表现明显比 IoU 更好。但是当没有重叠时，GIoU对水平和竖直方向监督效果不够（由GIoU Loss公式即可知道），误差也比较难降下来
DIoU和CIoU误差曲线：收敛快速稳定

在这里插入图片描述