卷积(Convolution)
卷积神经网络一直都是计算机视觉任务的标配。卷积有两个基本的性质:
- 空间不变性(spatial-agnostic)
空间不变性使得卷积能够在所有位置共享参数,并充分利用视觉特征的“平移等变性”。 - 通道特异性(channel-specific)
通道特异性使得卷积能够充分建模通道之间的关系,提高模型的学习能力。
卷积过程
-
Standard Convolution

设 X ∈ R H × W × C i X \in R^{H \times W \times C_i} X∈RH×W×Ci是输入的特征图像, H , W H,W H,W是特征图的高度和宽度, C i C_i Ci是输入的通道数。在特征向量 X X X的立方体内部,位于图像点阵单元中的每个特征向量 X i , j ∈ R C i X_{i,j} \in R^{C_i} Xi,j∈RCi认为是代表某些高级语义模式的像素。一组固定核大小为 K × K K \times K K×K的 C 0 C_0 C0卷积滤波器表示为 F ∈ R C 0 × C i × K × K F \in R ^{C_0 \times C_i \times K \times K}

本文深入探讨了卷积神经网络中的卷积操作,包括标准卷积、深度卷积和点卷积,以及它们在深度学习中的应用。此外,文章引入了Involution这一新概念,它是对卷积的补充,具有空间特异性和通道不变性的特点,旨在提高模型效率和精度。实验表明,Involution在图像分类、目标检测和语义分割等任务上表现优越,尤其是在处理长距离关系上具有优势。
最低0.47元/天 解锁文章
2420





