目录
1、什么是注意力机制?
简要来说,注意力机制就是要让网络关注到它更需要关注的地方。
在卷积神经网络去处理图片的时候,我们会更希望卷积神经网络能从大量的信息中筛选出更重要的信息,而不是什么都关注,我们不可能手动去调节需要注意的地方,这个时候,如何让卷积神经网络去自适应的注意重要的物体变得极为重要。而注意力机制就是实现网络自适应注意的一个方式。
在神经网络中引入注意力机制的方法有很多种,以卷积神经网络为例,既可以在空间维度引入注意力机制,也可以在通道维度增加注意力机制(SENet),当然也有混合维度(CBAM),即在空间维度和通道维度都增加注意力机制。
总的来说,注意力机制可以分为通道注意力机制,空间注意力机制,以及二者的结合。
2、摘要
近年来,通道注意力机制被证明在提高深度卷积神经网络(cnn)性能方面具有巨大潜力。然而,大多数现有方法致力于开发更复杂的注意力模块以实现更好的性能,这不可避免地增加了模型的复杂性。为了克服性能和复杂性权衡的矛盾,提出了一种高效的通道注意力(ECA)模块,该模块仅涉及少量参数,同时带来明显的性能增益。通过剖析SENet中的通道注意力模块,经验表明,避免降维对学习通道注意力很重要,适当的跨通道交互可以在显著降低模型复杂度的同时性能。因此,本文提出了一种无需降维的局部跨通道交互策略,可以通过一维卷积高效实现。此外,提出了一种自适应选择一维卷积核大小的方法,确定局部跨通道交互的覆盖率。
关键点:避免降维,适当跨通道交互、自适应一维卷积核大小的算法
这里主要是对SENet通道注意力机制进行改进,去掉了全连接层,在全局平均池化后街上一个一维卷积层。
上图是使用RESNet作为骨干网络的注意力模块在分类精度、网络参数和FLOPs方面的比较。
横轴为网络参数量(百万)、纵轴为Top-1 准确率。
从图中可以看出ECA-Net具有较高的准确率,同时模型复杂度也更低。