CNN卷积池化后维度的变化

最新推荐文章于 2025-10-20 09:00:00 发布

原创最新推荐文章于 2025-10-20 09:00:00 发布 · 1.1w 阅读

CC 4.0 BY-SA版权

文章标签：

4 篇文章

订阅专栏

本文详细探讨了CNN中卷积和池化操作后输出维度的计算方法。介绍了输入维度、卷积核大小、步长、填充等关键参数的影响，并给出保持卷积后维度一致的padding策略。对于池化操作，同样阐述了输出维度的计算公式，帮助理解CNN网络的维度变化规律。

部署运行你感兴趣的模型镜像

CNN的卷积操作后维度变化：

输入维度： $W_{1} \times H_{1}\times D_{1}$ ，分别代表输入样本的长宽高
卷积操作的超参数
1. 卷积核个数： $K$
2. 卷积核大小： $F\times F$
3. 滑动步长（Stride）： $S$
4. 填充（Padding）： $P$
则输出的维度为，其中
1. $W_{2} = [(W_{1}-F+2P)/S]+1$
2. $H_{2} = [(H_{1}-F+2P)/S]+1$
3. $D_{2} = K$
由于CNN的参数共享机制，每个卷积核的参数个数为 $F*F*D_{1}$ ，共有 $(F*F*D_{1})*K$ 个权重和 $K$ 个偏置
若想要卷积后得到的矩阵长宽与卷积前保持一致，则当时
1. 卷积核为3时 padding 选择1
2. 卷积核为5时 padding 选择2
3. 卷积核为7时 padding 选择3

CNN的池化操作后维度变化：

输入维度： $W_{1} \times H_{1}\times D_{1}$ ，分别代表输入样本的长宽高
池化操作的超参数
1. 池化层大小： $F\times F$
2. 滑动步长（Stride）： $S$
3. 填充（Padding）： $P$
则输出的维度为，其中
1. $W_{2} = [(W_{1}-F+2P)/S]+1$
2. $H_{2} = [(H_{1}-F+2P)/S]+1$
3. $D_{2} = D_{1}$