卷积神经网络图片的尺寸变化及其推导

本文介绍了卷积神经网络中卷积层和池化层输出图像尺寸的计算公式,帮助理解不同参数设置如何影响图像尺寸。通过实例解释了卷积核和池化层的移动步长、核尺寸、填充数对输出尺寸的影响。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

大部分转自:https://blog.youkuaiyun.com/qq_36444039/article/details/103984502

笔者以前搭建深度学习模型的时候,对于每一步卷积池化后图片的尺寸和大小很迷茫,不知道如何计算的。
这里,我给大家分享几个公式,帮助大家理解。不明白的欢迎在下方留言。

1、卷积层(Conv Layer)的输出张量(图像)的大小
定义如下:
O=输出图像的尺寸。
I=输入图像的尺寸。
K=卷积层的核尺寸
N=核数量
S=移动步长
P =填充数
输出图像尺寸的计算公式如下:
在这里插入图片描述

上述公式的 分式部分 向下取整

公式推导:画出图片,将卷积核顶在图片的最左上角,从卷积核的右边缘开始考虑。

卷积核的右边缘位于第K个位置,还剩下L-K+2*P个位置可以去移动,一次向右移动S步。

所以,卷积核还能移动(I-K+2P)\S (向下取整)步。再加上本身就处在的位置,所以总共是(I-K+2P)\S(下取整)+1

如果需要保持原来的尺寸:通常S = 1,K = 2P+1, 如padding为0, kernel为1,padding为1,kernel为3

如果需要尺寸减小为原来的一半(DCGAN实现的discriminator有):通常S = 2,K = 2P+2, 如padding为0kenerl为2,padding为1,kernel为4

2、池化层(MaxPool Layer)的输出张量(图像)的大小

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值