CNN的输入图像尺寸问题

最新推荐文章于 2023-10-18 19:04:57 发布

原创最新推荐文章于 2023-10-18 19:04:57 发布 · 1.1w 阅读

·

6

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#CNN #输入图像尺寸 #crop_size #resize

深度学习同时被 2 个专栏收录

18 篇文章

订阅专栏

5 篇文章

订阅专栏

本文解释了为何卷积神经网络（CNN）需要固定输入图像大小，尤其是在全连接层部分。探讨了不同处理方法，如resize和crop_size参数的使用，以及它们在训练和测试阶段的不同作用。

输入图片的大小需要固定

我们知道CNN输入图片的大小需要固定，但是这是为什么呢？
其实在网络结构中卷积层是不需要固定图像的大小（它的输出大小是跟输入图像的大小相关的），一般情况下输入尺寸都会大于常用的卷积核大小。有固定输入图像大小需求的是全连接部分，全连接部分的参数的个数是需要固定的。

解决方案

当然可能我们的数据集的大小并不统一，这时候就需要进行处理了
1.可以在输入网络之前进行resize，将图像全部resize成统一大小。
2.可以在网络的数据层设置crop_size参数，该部分是的意思是对原图进行裁剪。

crop_size

crop_size的意思是裁剪，在训练和测试两种情况时的裁剪方案是不一样的。代码请看src/caffe/data_transformer.cpp
在这里插入图片描述
意思是如果设置了crop_size参数则有两种裁剪方案。
1.训练：随机裁剪
2.测试：裁剪中间部分

参考：https://blog.youkuaiyun.com/u011762313/article/details/48343799

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。