一、本文介绍
本文给大家介绍将LRSA局部区域自注意力模块应用于YOLOv11,能提升其在细节捕捉、小物体检测和长距离依赖建模方面的能力,同时减少计算复杂度。LRSA增强局部特征交互,改善复杂背景下的检测精度,并保持较高的推理效率,特别适用于实时目标检测任务。具体怎么使用请看全文!
展示部分YOLOv11改进后的网络结构图:
🚀 创新改进1结构图 : yolov11n_LRSA.yaml

专栏改进目录:YOLOv11改进专栏包含卷积、主干网络、各种注意力机制、检测头、损失函数、Neck改进、小目标检测、二次创新模块、C2PSA/C3k2二次创新改进、全网独家创新等创新点改进
全新YOLOv11-发论文改进专栏链接:全新YOLOv11创新改进高效涨点+永久更新中(至少500+改进)+高效跑实验发论文
本文目录
1.首先在ultralytics/nn/newsAddmodules创建一个.py文件
2.在ultralytics/nn/newsAddmodules/__init__.py中引用
🚀 创新改进2 : yolov11n_C3k2_LRSA.yaml
二、LRSA模块介绍

摘要:基于变换器的方法在低级视觉任务(如图像超分辨率,SR)中展示了令人印象深刻的表现。然而,它的计算复杂度随着空间分辨率的增加而呈二次增长。为了缓解这一问题,一系列工作尝试通过将低分辨率图像划分为局部窗口、轴向条带或膨胀窗口来进行处理。SR通常利用图像中的冗余信息进行重建,这种冗余不仅出现在局部区域,还出现在长距离区域。然而,这些方法将注意力计算限制在内容无关的局部区域,直接限制了注意力捕捉长距离依赖的能力。为了应对这些问题,我们提出了一种轻量级的内容感知Token聚合网络(CATANet)。具体而言,我们提出了一种高效的内容感知Token聚合模块,用于聚合长距离内容相似的Token,该模块在所有图像Token之间共享Token中心,并仅在训练阶段更新这些Token中心。然后,我们利用组内自注意力来实现长距离信息交互。此外,我们设计了组间交叉注意力,以进一步增强全局信息交互。实验结果表明,与最先进的基于集群的方法SPIN相比,我们的方法在PSNR上提高了最大0.33dB,且推理速度几乎加倍。
订阅专栏 解锁全文
2862

被折叠的 条评论
为什么被折叠?



