数据增强:
v4:几何畸变,光照畸变,图像遮挡,CutMix+Mosaic,SAT,Class label smoothing
v5:几何畸变,光照畸变,Mosaic、anchors free
网络结构
Backbone:CSPDarknet53 (深度和宽度不同)
Neck:PANET+SPP
Head:三个特征层的输出
激活函数
v4:Mish
v5:Leaky RuLU+sigmoid
optim
v4:SGD
v5:较小的数据集:Adam 较大的数据集:SGD
loss
v4:CIOU
v5:GIOU+Focal loss
- IoU算法是使用最广泛的算法,大部分的检测算法都是使用的这个算法。
- GIoU考虑到,当检测框和真实框没有出现重叠的时候IoU的loss都是一样的,因此GIoU就加入了C检测框(C检测框是包含了检测框和真实框的最小矩形框),这样就可以解决检测框和真实框没有重叠的问题。但是当检测框和真实框之间出现包含的现象的时候GIoU就和IoUloss是同样的效果了。
- DIoU考虑到GIoU的缺点,也是增加了C检测框,将真实框和预测框都包含了进来,但是DIoU计算的不是框之间的交并,而是计算的每个检测框之间的欧氏距离,这样就可以解决GIoU包含出现的问题。
- CIoU就是在DIoU的基础上增加了检测框尺度的loss,增加了长和宽的loss,这样预测框就会更加的符合真实框。
本文探讨了深度学习目标检测中数据增强的技术,包括几何和光照畸变、图像遮挡、CutMix+Mosaic等方法,以及网络结构如CSPDarknet53、PANET+SPP和多层输出的Head设计。同时,对比了Mish与LeakyReLU+sigmoid激活函数,以及SGD和Adam优化器在不同数据集上的应用。在损失函数方面,研究了CIOU、GIOU和Focalloss在改进IoU算法上的作用,强调了它们对检测精度的提升。
1800

被折叠的 条评论
为什么被折叠?



