BAM: Bottleneck Attention Module算法笔记

BAM是深度学习中的注意力模块,旨在提升卷积神经网络性能。通过channel和spatial两个路径获取Attention Map,形成分层注意力机制。在ResNet中应用时,BAM能消除低层次特征并聚焦高级语义。实验表明,空洞卷积在空间注意力分支中有效,元素求和在结合通道和空间注意力时表现最佳。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

论文地址
姊妹篇
BAM: Bottleneck Attention Module
这是CBAM的姊妹篇,原班人马打造,不得不服
摘要:在这项工作中,我们把重心放在了Attention对于一般深度神经网络的影响上,我们提出了一个简单但是有效的Attention 模型—BAM,它可以结合到任何前向传播卷积神经网络中,我们的模型通过两个分离的路径 channel和spatial, 得到一个Attention Map,实验验证了我们算法的有效性。
整体结构图如下:
在这里插入图片描述

这里作者将BAM放在了Resnet网络中每个stage之间。有趣的是,通过可视化我们可以看到多层BAMs形成了一个分层的注意力机制,这有点像人类的感知机制。BAM在每个stage之间消除了像背景语义特征这样的低层次特征,然后逐渐聚焦于高级的语义–明确的目标(比如图中的单身狗)。

主要思想:
channel attention branch
对于给定的feature map F ∈ \in R C ∗ H ∗ W R^{C*H*W} RCHW,BAM可以得到一个3D的Attention map M(F) ∈ \in R C ∗ H ∗ W R^{C*H*W} RC

### 关于Bottleneck的流程图 #### BAM (Bottleneck Attention Module) 瓶颈注意模块(BAM)是一种用于提升网络表示能力的方法,该模块被置于网络的关键瓶颈位置以优化信息流。具体来说,BAM通过两个路径来决定关注哪些区域以及如何调整这些区域的重要性: - **空间分支**:负责确定应该聚焦的空间位置。 - **通道分支**:专注于选择重要的特征通道。 这两个分支的结果随后相加并与输入特征映射相结合,从而实现对原始特征的选择性增强或抑制[^1]。 ```mermaid graph LR; A[Input Feature Map] --> B[Spatial Branch]; A --> C[Channel Branch]; B --> D[BAM Output]; C --> D; D --> E[Enhanced Feature Map]; ``` 此图表展示了BAM的工作原理,其中输入特征图分别进入空间分支和通道分支处理后合并成最终输出,即经过改进后的特征图。 #### Bottleneck Transformer 对于Bottleneck Transformers而言,其核心在于将自注意力机制融入到ResNet架构中的特定层——通常是最后几个瓶颈块内。这种设计允许模型更好地捕捉长期依赖关系并改善整体表现,同时保持较低的参数复杂度[^2]。 ```mermaid graph TB; subgraph ResNet Backbone input(Input Image); conv(Conv Layers); bottleneck_1(Bottleneck Block 1); bottleneck_2(Bottleneck Block 2); bottleneck_n(Bottleneck Block N); output(Output Features); end subgraph Global Self-Attention Mechanism gsa(Global Self-Attention Layer); end input --> conv; conv --> bottleneck_1; bottleneck_1 --> bottleneck_2; bottleneck_2 --> gsa; gsa --> bottleneck_n; bottleneck_n --> output; ``` 上述Mermaid语法定义了一个简化版的ResNet加上全局自注意力机制的结构图,显示了数据从输入图像传递到最后输出特征的过程,其中包括了带有自注意力机制的瓶颈块。
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值