【论文笔记】(Frequency)FcaNet: Frequency Channel Attention Networks

本文挑战了全局平均池化在注意力机制中的普遍使用,指出其在频域中仅捕获最低频率信息。作者提出FcaNet,一种多光谱通道注意力框架,通过2D离散余弦变换在频域中利用多个频率信息增强特征多样性。通过选择最重要的频率分量,FcaNet能更好地表征不同通道的语义信息,从而提升模型性能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

《FcaNet: Frequency Channel Attention Networks》

question
常见的注意力机制,都是默认将GAP(global average pooling )作为一个不可或缺的预处理过程,然而文中提出GAP是频域中特征分解的一个特例,因此提出在频域进行注意力机制的预处理过程。


对于channel attention,GAP由于简单和高效就被用来计算每个channel的标量代表该channel的重要性。然而GAP不能捕捉丰富的输入模式信息,以及当处理不同输入时缺少特征多样性。因此就有这个问题:仅仅均值信息是否足够表示各种通道。


分析过程
不同的channel可能有同样大小的均值,然而它们对于的语义信息却不同。从频域角度来分析,文中证明了GAP等同于DCT(discrete cosine transform)的最低频率,丢弃了其他包含有用信息的频率元素;CBAM也显示了仅仅使用GAP是不足够的,同时使用GAP和global max pooling可以增强特征多样性。


这篇论文提出了一个multi-spectral channel attention framework。可以利用多个但有限的频率信息增强特征多样性。


Channel attention
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值