yolo v4 v5 对比

原创于 2021-08-30 13:51:52 发布 · 1.2k 阅读

8 ·

CC 4.0 BY-SA版权

文章标签：

#自动驾驶

Computer Vision 专栏收录该内容

34 篇文章

订阅专栏

本文探讨了深度学习目标检测中数据增强的技术，包括几何和光照畸变、图像遮挡、CutMix+Mosaic等方法，以及网络结构如CSPDarknet53、PANET+SPP和多层输出的Head设计。同时，对比了Mish与LeakyReLU+sigmoid激活函数，以及SGD和Adam优化器在不同数据集上的应用。在损失函数方面，研究了CIOU、GIOU和Focalloss在改进IoU算法上的作用，强调了它们对检测精度的提升。

部署运行你感兴趣的模型镜像

数据增强：
v4：几何畸变，光照畸变，图像遮挡，CutMix+Mosaic，SAT，Class label smoothing
v5：几何畸变，光照畸变，Mosaic、anchors free

网络结构
Backbone:CSPDarknet53 （深度和宽度不同）
Neck:PANET+SPP
Head:三个特征层的输出

激活函数
v4：Mish
v5：Leaky RuLU+sigmoid

optim
v4：SGD
v5：较小的数据集：Adam 较大的数据集：SGD

loss
v4：CIOU
v5：GIOU+Focal loss

IoU算法是使用最广泛的算法，大部分的检测算法都是使用的这个算法。
GIoU考虑到，当检测框和真实框没有出现重叠的时候IoU的loss都是一样的，因此GIoU就加入了C检测框（C检测框是包含了检测框和真实框的最小矩形框），这样就可以解决检测框和真实框没有重叠的问题。但是当检测框和真实框之间出现包含的现象的时候GIoU就和IoUloss是同样的效果了。
DIoU考虑到GIoU的缺点，也是增加了C检测框，将真实框和预测框都包含了进来，但是DIoU计算的不是框之间的交并，而是计算的每个检测框之间的欧氏距离，这样就可以解决GIoU包含出现的问题。
CIoU就是在DIoU的基础上增加了检测框尺度的loss，增加了长和宽的loss，这样预测框就会更加的符合真实框。

您可能感兴趣的与本文相关的镜像