一张图片输入到神经网络中时,不断经过卷积层的卷积,中间特征结果的大小如何计算呢?
1.输入图片大小的计算
图片的长*宽 *位深(一个像素点的位数)
位深:8位,16位,24位,32位
位深是不同的,与图片的后缀形式有关系
2.中间卷积结果的大小计算
中间特征图大小的计算不同于原始图片大小的计算
中间特征张量有(W,H,C)宽、高、信道数
中间特征图大小计算= W*H*C*像素点位数
至于像素点的位数,在pytorch中比较常用的是torch.float32类型,即一个像素点用32bits存储
可以通过输出中间tensor的类型查找自己网络的像素点的位数
查找代码:
print(x.dtype) # x是中间张量
本文解释了如何计算神经网络接收图片时,输入大小的计算方法,以及卷积操作后中间特征图的大小。重点介绍了位深度对计算的影响,并提供了PyTorch中查找像素位数的方法。
14万+

被折叠的 条评论
为什么被折叠?



