论文作者:Xin Liu,Jie Liu,Jie Tang,Gangshan Wu
作者单位:Nanjing University
论文链接:http://arxiv.org/abs/2503.06896v1
内容简介:
1)方向:图像超分辨率
2)应用:图像超分辨率
3)背景:尽管基于Transformer的方法在图像超分辨率任务中表现出了令人印象深刻的性能,但其计算复杂度随着空间分辨率的增加呈平方级增长。为了缓解这一问题,一些方法尝试通过将低分辨率图像分割为局部窗口、轴向条纹或扩张窗口来减少计算量。然而,这些方法通常将注意力计算限制在与内容无关的局部区域,从而限制了注意力捕捉长程依赖的能力。
4)方法:为了解决这些问题,提出了一种轻量化的内容感知标记聚合网络(CATANet)。具体而言,提出了一种高效的内容感知标记聚合模块,用于聚合长程内容相似的标记。该模块在训练阶段共享所有图像标记的标记中心,并仅在训练阶段进行更新。然后,通过组内自注意力机制(intra-group self-attention)实现长程信息的交互。此外,设计了组间交叉注意力(inter-group cross-attention)机制,以进一步增强全局信息的交互。
5)结果:实验结果表明,与基于聚类的最新方法SPIN相比,CATANet在图像超分辨率任务中表现优越,最大PSNR(峰值信噪比)提升了0.33dB,推理速度几乎是其两倍,证明了该方法在性能和效率上的优势。