YOLOv3用到的tricks介绍

本文介绍了YoloV3网络的优化策略,包括使用Darknet53作为backbone避免池化和全连接层,以及矩形推理(Rectangular Inference)以提高训练和推理效率,减少了预处理中的冗余信息。同时,讨论了矩形训练与数据加载器中shuffle的不兼容性,并提及了引入的SE注意力机制增强模型表现。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1. yolov3的backbone为darknet53,整个网络中是没有用到池化层和全连接层

 

2. Rectangular inference(矩形推理)/ training(矩形训练)

        矩形推理就是为了加快网络训练与推理速度速度,因为yolov3在训练的时候会对我们输入的图像数据进行预处理,将图像缩放到416*416,再送到网络中进行训练。这样的话会产生很多无用的信息。

正常预处理

        如图,我们看到,我们添加了很多对我们训练的干扰信息,存在很多信息的冗余,所以如果用到Rectangular

 

Rectangular

        我们需要注意到,这个tirck确实能够减少信息的冗余,但是这样会导致不同的输入图像的尺寸在预处理后,一个bach中的图像长宽比会有很大的差别,yolov3为我们提供将比例相近的图片放在一个 batch,这样显然填充的就更少一些了。

        同时矩形训练与dataloader中的shuffle不可共用,原理就不用多说了。

3. Attention机制

        yolov3引入了SE注意力机制

如有错误,欢迎批评指正

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值