卷积之后尺寸变化

博客介绍了卷积尺度变化,包括输入矩阵、卷积后矩阵、权重矩阵和偏置的格式,给出了卷积后图像高度和宽度的计算公式。还提及深度学习框架中CNN的两种padding方式,即'SAME'和'VALID',并给出了对应输出尺寸的计算方法及参考链接。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

卷积尺度变化

输入矩阵格式: 样本数目,图像高度,图像宽度,图像通道数
卷积之后矩阵格式: 样本数目,图像高度,图像宽度,图像通道数 (后三个维度在卷积之后会发生变化)
权重矩阵(卷积核的格式:卷积核高度,卷积核宽度,输入通道数,输出通道数(以RGB为例,每个通道对应自己的一个权重矩阵),输出通道数(卷积核的个数)
偏置: 输出通道数(一个卷积核对应一个偏置)
H_out = (H_in-H_k+2padding)/stride + 1
W_out = (W_in-W_k+2
padding)/stride + 1

CNN中卷积层的计算细节 - Michael Yuan的文章 - 知乎
https://zhuanlan.zhihu.com/p/29119239

在深度学习框架中,如果我们选择padding = 'SAME',输出的尺寸为W/S \lceil W/S \rceil

如果我们选择为padding = 'Valid',输出尺寸: \lceil (W-F+1)/S \rceil (向上取整)
参考-TensorFlow中CNN的两种padding方式“SAME”和“VALID”

转载于:https://www.cnblogs.com/lzida9223/p/10551808.html

### 全卷积神经网络中的维数变化原理 全卷积神经网络(FCN)在处理图像数据的过程中,通过一系列操作保持输入和输出的空间分辨率一致。具体来说: #### 特征提取阶段 在网络前端部分,通常采用标准的卷积神经网络结构来进行特征提取。这一过程会逐步减少空间维度(高度和宽度),同时增加通道数量以捕捉更复杂的模式[^1]。 ```python import torch.nn as nn class FeatureExtractor(nn.Module): def __init__(self, pretrained_net): super(FeatureExtractor, self).__init__() # 使用预训练模型去掉最后两层 self.features = nn.Sequential(*list(pretrained_net.children())[:-2]) def forward(self, x): return self.features(x) ``` #### 通道转换阶段 为了使每个像素点能够对应到具体的类别上,在经过多层卷积之后,利用 \(1 \times 1\) 的卷积核调整通道数目至等于类别的总数目。这种做法不仅减少了计算量还使得后续可以逐像素地进行分类预测[^3]。 ```python def channel_conversion(input_channels, num_classes): conv_1x1 = nn.Conv2d(in_channels=input_channels, out_channels=num_classes, kernel_size=1) return conv_1x1 ``` #### 尺寸恢复阶段 由于前面的操作可能会缩小原始图片的高度和宽度,因此需要引入反卷积/转置卷积来放大这些被压缩后的特征映射回到原图大小。这一步骤确保了最终输出与输入具有相同的尺寸,并且每一个位置都携带有关于其所属类别的信息[^4]。 ```python def size_restoration(num_classes, scale_factor): upsample_layer = nn.ConvTranspose2d( in_channels=num_classes, out_channels=num_classes, kernel_size=scale_factor, stride=scale_factor ) return upsample_layer ``` 综上所述,整个过程中虽然经历了多次降采样和平滑化处理,但是通过精心设计的架构以及特定类型的层组合,成功实现了从任意尺度的输入到同样尺度但带有语义标签分布的结果之间的映射关系。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值