YOLOV3学习记录——输入图像前的细节问题

#YOLOV3学习记录——输入图像前的细节问题

背景

通常,神经网络对输入图像的尺寸是有要求的。YOLOV3要求图像是一个矩形,但往往自定义数据集的图像是不规则尺寸。因此这种情况下需要进行Resize操作。其中Padding不当会导致一定问题。

讨论

如下图,左面为原图,右面为resize之后的输入图像。以原图像最长边为基准边计算缩放系数,使其变换到长度为设定尺寸,然后整张图像等比缩放。Padding采用灰色背景填充,即(128,128,128).如果采用0填充会导致在推理阶段出现问题。网络的输出张量的输出值异常,要么没有检测框,要么出现大量检测框且是乱的。以上是更改了三个YOLOv3项目代码得出来的结论,希望大家少走弯路。
在这里插入图片描述

结论

在对图像预处理时,不应该采用(0,0,0)零填充,建议使用(128,128,128)填充,其余填充方式未尝试。

参考网址

【1】YOLOV3学习记录——输入图像前的细节问题https://blog.youkuaiyun.com/weixin_45482843/article/details/109427426

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值