超详细的卷积后大小的计算公式

该博客介绍了卷积计算的基础知识,以ResNet50为例,解释了输入图片大小、卷积核大小、步长和padding如何影响输出图片大小。通过公式N=(W−F+2P)/S+1,计算出经过第一层卷积后,输入[1,3,224,224]的图像将变为[1,64,112,112]。博客探讨了卷积操作中通道数的变化,并提供了卷积动态图解链接帮助理解。
部署运行你感兴趣的模型镜像

计算公式定义

定义几个参数

输入图片大小 W×W
卷积核大小 F×F
步长 S
padding的像素数 P
于是我们可以得出计算公式为:
N = (W − F + 2P )/S+1

输出图片大小为 N×N
以resnet50为例,输入为[1,3,224,224],其中1为batchsize,3为通道数,224为height和width。

经过第一层卷积后,其大小为[1,64,112,112]

in_channels= 3//输入通道
out_channels= 64 //输出通道
nn.Conv2d(in_channels, out_channels, kernel_size=7, stride=2, padding=3, bias=False)

N = (W − F + 2P )/S+1 = (224-7+2x3)/2 + 1 = 112

解释

1为batchsize,不改变。
对于通道数,会生成与设定的输出通道个数相同个数的卷积核,对图片进行卷积,即卷积核的个数等于输出特征图的通道数。
得到最终输出大小为[1,64,112,112]
(W − F + 2P )相当于计算除了第一次卷积后剩下的可用来卷积的大小
(W − F + 2P )/S为按照S大小的步长在刚刚得到的大小上可以向后移动多少次,即还可以做几次卷积
因为不包括第一次卷积,所以再加上一个1,
即N = (W − F + 2P )/S+1
输出大小 = (图片宽或高 - 卷积核大小 + padding大小)/ 步长 + 1
对于宽和高不同的图片可分别用上述公式计算,得到最终的输出大小。

卷积动态图解参考:
https://cs231n.github.io/assets/conv-demo/index.html

您可能感兴趣的与本文相关的镜像

TensorFlow-v2.15

TensorFlow-v2.15

TensorFlow

TensorFlow 是由Google Brain 团队开发的开源机器学习框架,广泛应用于深度学习研究和生产环境。 它提供了一个灵活的平台,用于构建和训练各种机器学习模型

评论 10
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值