深度可分离卷积、普通卷积、逐点卷积

1、普通卷积

这张图展示了一个卷积神经网络(CNN)中卷积层的计算过程,具体解释如下:

(1) 输入部分 :3 channel Input:表示输入数据具有3个通道,通常类似于RGB图像的3个通道 ,以3个颜色不同的方块示意。

(2)卷积核(Filters)部分 :Filters * 4:这里有4个卷积核,每个卷积核是三维的(考虑到输入的多通道)。图中每个卷积核用一个小方块阵列表示,且堆叠起来展示。

(3) 输出特征图(Maps)部分 :Maps * 4:经过卷积操作后,会生成4个输出特征图,图中以4个灰色方块表示。每个输出特征图是由对应的卷积核与输入数据进行卷积运算得到的。

(4) 参数量计算 :图中给出了参数量的计算公式 `3*3*3*4` :第一个 3表示卷积核的高度为3(卷积核是正方形,宽高相同 )。第二个3表示卷积核的宽度为3 。 第三个 3表示输入通道数为3 ,因为卷积核要对每个输入通道进行卷积操作,所以通道数参与参数量计算。4 表示卷积核的数量为4 。 - 计算结果 `3*3*3*4 = 108` ,即该卷积层的参数量为108 。

2、深度可分离卷积

(1)输入:“3 channel Input” 表示输入数据有 3 个通道,就像 RGB 图像那样,用 3 个颜色不同的方块展示。

(2) 卷积核:“Filters * 3” 说明有 3 个卷积核 。在深度可分离卷积里,每个卷积核只针对一个输入通道操作,图中每个卷积核以小方块阵列呈现。

(3)输出特征图(Maps):“Maps * 3” 指经过卷积操作会生成 3 个输出特征图,用 3 个灰色方块表示 ,每个由对应的卷积核与输入通道卷积得到。

(4)参数量计算 :图中给出参数量计算公式 `3*3*3` : 前两个 `3` 分别代表卷积核的高度和宽度(卷积核是正方形 )。最后一个 `3` 是卷积核数量 。因为深度可分离卷积中每个卷积核只处理一个通道,不涉及跨通道操作,所以不乘输入通道数 。  计算结果 `3*3*3 = 27` ,即该深度可分离卷积层的参数量为 27 。相比常规卷积,深度可分离卷积通过减少参数量降低计算量,在保持模型性能前提下提升计算效率,适用于资源受限场景。

3、逐点卷积

深度可分离卷积并没有进行各个通道数据的融合,因此接着进行以下卷积。

注意:27是深度可分离卷积的计算量

(1)丰富特征表达

深度卷积只在单个通道内进行卷积操作,没有跨通道交互 ,输出特征图通道数与输入通道数相同,可能导致特征表达有限。后续的 1×1 卷积(逐点卷积)能将深度卷积输出的通道进行线性组合,实现跨通道信息融合,增加特征多样性和表达能力 。比如在图像识别任务中,不同通道可能提取到边缘、纹理等不同特征,通过逐点卷积可将这些特征融合,使模型学习到更具判别性的特征 。

(2)调整通道数

可以根据任务需求和模型设计,灵活调整通道数 。通过设置 1×1 卷积核的数量,能增加或减少通道数,控制模型计算量和复杂度 。在设计轻量级模型时,可利用 1×1 卷积减少通道数,降低计算成本;在需要提取更丰富特征时,适当增加通道数 。

(3)提升模型性能

深度可分离卷积虽能减少参数量和计算量,但可能牺牲部分模型表达能力。后续操作通过合理融合特征、调整通道等,弥补深度卷积的不足,提升模型整体性能 。实验表明,这种组合能在参数量相近情况下,使模型性能优于仅使用深度卷积的情况 。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值