YOLOv13改进策略【注意力机制篇】| WACV-2024 D-LKA 可变形的大核注意针对大尺度、不规则的目标图像

D-LKA：可变形大核注意力机制

Limiiiing

已于 2025-10-30 12:38:14 修改

阅读量193

点赞数

CC 4.0 BY-SA版权

分类专栏： YOLOv13改进专栏文章标签： YOLO 深度学习计算机视觉目标检测

于 2025-08-20 10:02:56 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_42591591/article/details/150528976

YOLOv13改进专栏专栏收录该内容

157 篇文章 ¥99.90 ¥299.90

订阅专栏

一、本文介绍

本文记录的是利用D-LKA模块优化YOLOv13的目标检测网络模型。D-LKA 结合了大卷积核的广阔感受野和可变形卷积的灵活性，有效地处理复杂的图像信息。本文将其应用到v13中，并进行二次创新，使网络能够综合多种维度信息，更好地突出重要特征，从而提升对不同尺度目标和不规则形状目标的特征提取能力。

专栏目录：YOLOv13改进目录一览 | 涉及卷积层、轻量化、注意力、损失函数、Backbone、SPPF、Neck、检测头等全方位改进

专栏地址：YOLOv13改进专栏——以发表论文的角度，快速准确的找到有效涨点的创新点！

二、D-LKA介绍

2.1 设计出发点

解决传统卷积和注意力机制的局限性
- 传统卷积神经网络（CNN）在处理图像分割时，对于不同尺度的物体检测存在问题。如果物体超出对应网络层的感受野，会导致分割不足；而过大的感受野相比物体实际大小，背景信息可能会对预测产生不当影响。
- Vision Transformer（ViT）虽然能通过注意力机制聚合全局信息，但在有效建模局部信息方面存在局限，难以检测局部纹理。
充分利用体积上下文并提高计算效率
- 大多数当前方法处理三维体积图像数据时采用逐片处理的方式（伪3D），丢失了关键的片间信息，降低了模型的整体性能。
- 需要一种既能充分理解体积上下文，又能避免计算开销过大的方法，同时还要考虑医学领域中病变形状经常变形的特点。

2.2 原理

2.2.1 Large Kernel Attention（LKA）原理

相似感受野的构建<

了解本专栏

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Limiiiing 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。