YOLOv11涨点改进 | 全网独家创新、注意力改进篇 | CVPR 2025 | 引入LRSA局部区域自注意力模块,能提升其在细节捕捉、小目标检测和长距离依赖建模方面的能力

一、本文介绍

本文给大家介绍将LRSA局部区域自注意力模块应用于YOLOv11能提升其在细节捕捉、小物体检测和长距离依赖建模方面的能力,同时减少计算复杂度。LRSA增强局部特征交互,改善复杂背景下的检测精度,并保持较高的推理效率,特别适用于实时目标检测任务。具体怎么使用请看全文!

展示部分YOLOv11改进后的网络结构图:

🚀 创新改进1结构图 : yolov11n_LRSA.yaml

专栏改进目录:YOLOv11改进专栏包含卷积、主干网络、各种注意力机制、检测头、损失函数、Neck改进、小目标检测、二次创新模块、C2PSA/C3k2二次创新改进、全网独家创新等创新点改进

全新YOLOv11-发论文改进专栏链接:全新YOLOv11创新改进高效涨点+永久更新中(至少500+改进)+高效跑实验发论文

本文目录

一、本文介绍

二、LRSA模块介绍

2.1 LRSA模块结构图

2.2 LRSA模块的作用:

2.3 LRSA模块的优势:

2.4  LRSA模块的原理

三、完整核心代码

 四、手把手教你配置模块和修改task.py文件

1.首先在ultralytics/nn/newsAddmodules创建一个.py文件

2.在ultralytics/nn/newsAddmodules/__init__.py中引用

3.修改task.py文件

五、创建涨点yaml配置文件

🚀 创新改进1 : yolov11n_LRSA.yaml

🚀 创新改进2 : yolov11n_C3k2_LRSA.yaml

六、正常运行

二、LRSA模块介绍

摘要:基于变换器的方法在低级视觉任务(如图像超分辨率,SR)中展示了令人印象深刻的表现。然而,它的计算复杂度随着空间分辨率的增加而呈二次增长。为了缓解这一问题,一系列工作尝试通过将低分辨率图像划分为局部窗口、轴向条带或膨胀窗口来进行处理。SR通常利用图像中的冗余信息进行重建,这种冗余不仅出现在局部区域,还出现在长距离区域。然而,这些方法将注意力计算限制在内容无关的局部区域,直接限制了注意力捕捉长距离依赖的能力。为了应对这些问题,我们提出了一种轻量级的内容感知Token聚合网络(CATANet)。具体而言,我们提出了一种高效的内容感知Token聚合模块,用于聚合长距离内容相似的Token,该模块在所有图像Token之间共享Token中心,并仅在训练阶段更新这些Token中心。然后,我们利用组内自注意力来实现长距离信息交互。此外,我们设计了组间交叉注意力,以进一步增强全局信息交互。实验结果表明,与最先进的基于集群的方法SPIN相比,我们的方法在PSNR上提高了最大0.33dB,且推理速度几乎加倍。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值