深度学习中feature map、卷积核、卷积核个数、filter、channel的概念解释,以及CNN 学习过程中卷积核更新的理解

参照下面博客:
1、https://blog.youkuaiyun.com/qq_34197944/article/details/103574916?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-3.channel_param&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-3.channel_param
2、https://blog.youkuaiyun.com/xys430381_1/article/details/82529397
3、https://blog.youkuaiyun.com/cmdholder/article/details/85381707``

4、神经网络及CNN中的通道、共享权重、特征映射等的理解

### 多通道多卷积核的卷积操作原理 #### 卷积核与特征映射的关系 在深度学习中的卷积神经网络(CNN),当存在多个卷积核时,能够学习到不同类型的特征。每一个卷积核作为一个独立的学习单元,会生成一个对应的特征图(channel)[^1]。 对于一个多通道输入的情况(比如RGB彩色图片),每个卷积核实际上是一个三维结构,其宽度和高度匹配输入图像的空间维度,而第三个维度则等于输入channel的数量。这意味着单个卷积核会在所有输入channels上滑动并执行逐元素乘法求和的操作来计算响应值。因此,即使面对具有三个颜色分量(RGB)的数据集,也能有效地应用这种机制来进行特征检测[^3]。 #### 输出Feature Map的形成 假设有一个输入张量尺寸为\(H \times W \times C_{in}\)(高×宽×输入通道数), 使用了N个大小相同、形状为\(K_h × K_w × C_{in}\) (内核的高度×宽度×输入通道数目) 的卷积滤波器(filter/convolution kernel). 那么经过一次完整的二维空间上的扫描之后将会得到一个新的四维输出张量 \(H' \times W' \times N\) ,其中\(H'\) 和 \(W'\) 是通过考虑填充(padding) 及步幅(stride) 后调整过的新的高度和宽度;最后一个维度即代表了由这些不同卷积核所形成的feature maps数量——也就是最终output channels 数目. #### 特征表达能力提升 随着卷积层数加深以及更多卷积核的应用,CNN可以从原始像素级信息逐步抽象出更加复杂且语义丰富的高层特性描述子(high-level feature descriptors) 。例如,在早期阶段可能主要识别简单的局部图案(如边界线条); 而到了后期,则倾向于捕捉更为综合的对象组成部分乃至整体形态轮廓等全局属性[^2]. 更多的通道允许网络同时处理更多信息流,从而增强了对多样化视觉特性的感知力,有助于提高分类准确性和其他任务性能表现. ```python import torch.nn as nn class ConvLayer(nn.Module): def __init__(self, in_channels=3, out_channels=64, kernel_size=(5, 5)): super(ConvLayer, self).__init__() self.conv = nn.Conv2d(in_channels=in_channels, out_channels=out_channels, kernel_size=kernel_size) def forward(self, x): return self.conv(x) ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值