目录
一、ACmix注意力机制
1.1ACmix注意力介绍
ACmix设计为一个结合了卷积和自注意力机制优势的混合模块,旨在通过融合两种机制的优点来增强模型的表示能力和性能。工作流程图如下所示其中:(a)卷积(Convolution)、(b)自注意力(Self-Attention) 和 ©ACMix。每种方法处理特征的方式不同,以下我将为您简要介绍每个模块的工作流程和其作用。
-
卷积(Convolution) (a)
Stage I: 输入的特征图通过多个1x1卷积进行特征投影,目的是将通道数减少或映射到不同的空间维度。这一步相当于一个线性变换。
Stage II: 接下来通过一个标准的3x3卷积核对特征图进行局部特征提取,这是一种固定的窗口操作,只关注局部邻域内的信息。
作用:卷积操作是一种高效的局部信息提取方式,在保持计算效率的同时能够有效捕捉局部模式。但其局限性在于缺