Gated channel attention的门控通道

最新推荐文章于 2025-07-24 22:04:29 发布

原创最新推荐文章于 2025-07-24 22:04:29 发布 · 462 阅读

CC 4.0 BY-SA版权

文章标签：

Gated Channel Attention 是一种改进的注意力机制，通过引入门控机制来控制通道（channel）特征的选择和激活。门控通道的主要作用是增强或抑制特定通道的特征，从而使模型更好地聚焦于重要的特征，同时减少对不重要或冗余信息的依赖。

Gated Channel Attention通过引入动态的门控机制，使得对每个通道的注意力权重可以根据输入数据的特征进行调整。

门控向量的生成与作用

全局描述向量的生成：通过全局平均池化（GAP）或全局最大池化（GMP），将每个通道的特征图汇聚为一个标量，从而生成一个尺寸为C×1×1 的全局描述向量 𝑔 （表示的是每个通道的整体特征强度或重要性）。
门控向量的生成：该全局描述向量 𝑔被输入到一个或多个全连接层（通常包括一个降维操作）中，经过非线性激活函数（如 Sigmoid 或 ReLU）处理后，生成的输出即为门控向量 α。门控向量
α 的尺寸与全局描述向量 g 一样，也是 𝐶×1×1，每个值对应一个通道的权重。
门控向量的作用：这个门控向量 α 用于对原始输入特征图 𝑋的每个通道进行加权。具体来说，门控向量中的每个值会分别与对应的通道特征图进行元素逐一相乘。通过这种加权操作，模型能够增强那些重要的通道特征（即门控向量中值较大的通道），同时抑制不重要或冗余的通道特征（即门控向量中值较小的通道）。