yolo v4 v5 对比

本文探讨了深度学习目标检测中数据增强的技术,包括几何和光照畸变、图像遮挡、CutMix+Mosaic等方法,以及网络结构如CSPDarknet53、PANET+SPP和多层输出的Head设计。同时,对比了Mish与LeakyReLU+sigmoid激活函数,以及SGD和Adam优化器在不同数据集上的应用。在损失函数方面,研究了CIOU、GIOU和Focalloss在改进IoU算法上的作用,强调了它们对检测精度的提升。
部署运行你感兴趣的模型镜像

数据增强:
v4:几何畸变,光照畸变,图像遮挡,CutMix+Mosaic,SAT,Class label smoothing
v5:几何畸变,光照畸变,Mosaic、anchors free

网络结构
Backbone:CSPDarknet53 (深度和宽度不同)
Neck:PANET+SPP
Head:三个特征层的输出

激活函数
v4:Mish
v5:Leaky RuLU+sigmoid

optim
v4:SGD
v5:较小的数据集:Adam 较大的数据集:SGD

loss
v4:CIOU
v5:GIOU+Focal loss

  1. IoU算法是使用最广泛的算法,大部分的检测算法都是使用的这个算法。
  2. GIoU考虑到,当检测框和真实框没有出现重叠的时候IoU的loss都是一样的,因此GIoU就加入了C检测框(C检测框是包含了检测框和真实框的最小矩形框),这样就可以解决检测框和真实框没有重叠的问题。但是当检测框和真实框之间出现包含的现象的时候GIoU就和IoUloss是同样的效果了。
  3. DIoU考虑到GIoU的缺点,也是增加了C检测框,将真实框和预测框都包含了进来,但是DIoU计算的不是框之间的交并,而是计算的每个检测框之间的欧氏距离,这样就可以解决GIoU包含出现的问题。
  4. CIoU就是在DIoU的基础上增加了检测框尺度的loss,增加了长和宽的loss,这样预测框就会更加的符合真实框。

您可能感兴趣的与本文相关的镜像

GPT-oss:20b

GPT-oss:20b

图文对话
Gpt-oss

GPT OSS 是OpenAI 推出的重量级开放模型,面向强推理、智能体任务以及多样化开发场景

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值