YOLOV3学习记录——输入图像前的细节问题

最新推荐文章于 2025-03-21 21:01:26 发布

幽冥之花

最新推荐文章于 2025-03-21 21:01:26 发布

阅读量2.8k

点赞数 2

分类专栏：数据集深度学习

原文链接：https://blog.youkuaiyun.com/weixin_45482843/article/details/109427426

版权

深度学习同时被 2 个专栏收录

17 篇文章

订阅专栏

5 篇文章

订阅专栏

#YOLOV3学习记录——输入图像前的细节问题

背景

通常，神经网络对输入图像的尺寸是有要求的。YOLOV3要求图像是一个矩形，但往往自定义数据集的图像是不规则尺寸。因此这种情况下需要进行Resize操作。其中Padding不当会导致一定问题。

讨论

如下图，左面为原图，右面为resize之后的输入图像。以原图像最长边为基准边计算缩放系数，使其变换到长度为设定尺寸，然后整张图像等比缩放。Padding采用灰色背景填充，即(128,128,128).如果采用0填充会导致在推理阶段出现问题。网络的输出张量的输出值异常，要么没有检测框，要么出现大量检测框且是乱的。以上是更改了三个YOLOv3项目代码得出来的结论，希望大家少走弯路。
在这里插入图片描述

结论

在对图像预处理时，不应该采用(0,0,0)零填充，建议使用(128,128,128)填充，其余填充方式未尝试。

参考网址

【1】YOLOV3学习记录——输入图像前的细节问题https://blog.youkuaiyun.com/weixin_45482843/article/details/109427426

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。