一、与yoloV4相比,yoloV5的改进
- 输入端:在模型训练阶段,使用了Mosaic数据增强、自适应锚框计算、自适应图片缩放
- 基准网络:使用了FOCUS结构和CSP结构
- Neck网络:在Backbone和最后的Head输出层之间插入FPN_PAN结构
- Head输出层:训练时的损失函数GIOU_Loss,预测筛选框的DIOU_nns
二、yoloV5结构框架
CBL:CBL模块是由Conv+BN+Leaky_relu激活函数组成
Res unit:借鉴ResNet中的残差结构,用来构建深层网络,CBM是残差模块中的子模块
CSP1_X:借鉴CSPNet网络结构,由CBL,Res unit,卷积层,Concate组成
CSP2_X:借鉴CSPNet网络结构,由卷积层积X个Res unit模块Concate组成
FOCUS:将多个slice结果Concate起来,将其送入CBL模块中
SPP:采用1x1,5x5,9x9和13x13的最大池化方式,进行多尺度融合
三、Mosaic数据增强
CutMix:将2张图进行拼接
Mosaic:在CutMix基础上进行改进,采用4张图片,按照随机缩放,随机裁剪和随机排布的方式进行拼