【CNN】卷积神经网络中的 1*1 卷积的作用

最新推荐文章于 2025-11-18 17:04:58 发布

原创最新推荐文章于 2025-11-18 17:04:58 发布 · 8k 阅读

63 ·

CC 4.0 BY-SA版权

文章标签：

#CNN #1*1 #卷积 #googlenet #resnet

CNN 专栏收录该内容

3 篇文章

订阅专栏

本文探讨了1×1卷积在卷积神经网络（CNN）中的核心作用，包括改变通道数量以实现降维/升维、数据融合、减少计算量以及作为非线性操作的组成部分。1×1卷积在googLeNet、ResNet等深度学习模型中发挥关键作用，有助于优化计算效率和提高网络表达能力。

部署运行你感兴趣的模型镜像

在论文 Network In Network 中，提出了一个重要的方法： $1\times1$ 卷积。这个方法也在后面比较火的方法，如 googLeNet、ResNet、DenseNet ，中得到了非常广泛的应用。特别是在 googLeNet 的Inception中，发挥的淋漓尽致。

初次看到 $1\times1$ 卷积，可能会觉得没有什么作用，因为给人的感觉就是 $1\times1$ 的卷积核好像并没有改变什么。但如果对卷积操作有过深入的理解，就会发现并没有那么简单。

这里强调一下，下图只是用了一个卷积核（filter）。下面的 32 是为了匹配上一层的channels，输出的结果只有一个channel。这里如果不理解，可以看我的另一篇博客，【CNN】理解卷积神经网络中的通道 channel。
非线性

总结了一下其作用，主要分为一下两种：

改变通道（channels）
- 降维 / 升维
- 数据融合
- 减少计算量
非线性操作

下面详细介绍一下。

改变通道（channels）

之前有详细讲过对通道的理解。通过改变 $1\times1$ 卷积核的数量来改变输出通道的数量。

降维 / 升维

由于 $1\times1$ 并不会改变 height 和 width，改变通道的第一个最直观的结果，就是可以将原本的数据量进行增加或者减少。这里看其他文章或者博客中都称之为升维、降维。但我觉得维度并没有改变，改变的只是 height × width × channels 中的 channels 这一个维度的大小而已。