YOLOv3 SPP网络

YOLOv3SPP使用Mosaic图像增强提升数据多样性,SPP模块确保特征融合。文章讨论了IoU、GIoU、DIoU和CIoU四种损失函数在目标检测中的应用,特别是它们对定位精度和收敛速度的影响。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

YOLOv3 SPP

Mosaic图像增强

在这里插入图片描述
随机选取多张图片,拼接成一张图片 ,能够增加数据的多样性,增加目标个数。由于多张图片进行拼接,因此BN层能够一次性统计多张图像的参数,此时BN层求得的均值和方差更接近整个数据集的均值和方差。

SPP模块

在这里插入图片描述
SPP模块步距为1,因此经过maxpool层的大小不发生变化,此时可以实现不同尺度的特征融合。

损失计算

在这里插入图片描述

  • IoU损失

在yolov3网络中所采用的损失是简单的L2损失函数,但是如下图所示,L2损失不能很好的反应两个目标边界框之间的重合程度(圆心到右上角之间的距离一致)。
IOU具有尺度不变性:不论矩形框的面积是大是小,重叠的程度和矩形框的面积无关。
在这里插入图片描述
常见的计算公式: I O U l o s s = 1 − I O U IOU_{loss}=1-IOU IOUloss=1IOU

  • GIoU 损失

在这里插入图片描述
其中 A c A^c Ac表示用一个最小的矩形将两个边界框框住的面积, u u u表示两个边界框并集的面积。
但是当两个边界框水平或者垂直对齐的时候,GIOU会退化成普通的IOU损失。

  • DIoU损失

上述提到的两种损失计算都具有收敛速度慢,回归定位不准确的问题,如右下图所示,上述两种损失不能准确的反应定位精度。
在这里插入图片描述
在这里插入图片描述
因为我们需要计算的目的是让两者的距离更小,所以可以不用面积进行计算而直接是计算两者的距离,这样可以针对于问题有更好的求解方式。其中 b b b表示预测中心点的坐标,而 b g t b^{gt} bgt表示真实中心点的坐标。

  • CIoU损失

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值