YOLOv13改进策略【Neck】| CVPR2024 LGAG:大核分组注意力门模块,3×3分组卷积与注意力协同的特征精准融合

一、本文介绍

本文记录的是利用LGAG 模块改进 YOLOv13 的颈部融合部分

LGAG(Large-kernel Grouped Attention Gate)通过3×3分组卷积与注意力机制结合引导解码器处理特征与跳接特征的精准融合。本文利用LGAG模块,通过3×3分组卷积扩大感受野以捕捉更广泛局部空间上下文,同时结合注意力机制生成自适应注意力系数,对YOLOv13中关键目标特征赋予高激活值、抑制冗余背景特征在特征融合阶段实现全局语义与局部细节的高效结合,减少计算成本的同时提升特征表达能力,增强模型对复杂场景下目标的检测精度与效率。


专栏目录:YOLOv13改进目录一览 | 涉及卷积层、轻量化、注意力、损失函数、Backbone、SPPF、Neck、检测头等全方位改进

专栏地址:YOLOv13改进专栏——以发表论文的角度,快速准确的找到有效涨点的创新点!


二、LGAG模块介绍

EMCAD:Efficient Multi-scale Convolutional Attention Decoding for Medical Image Segmentation

LGAG模块设计的出发点、结构与原理

一、设计出发点

在医学图像分割的解码器中,需将经解码器处理的特征与跳接连接(skip connection)传递的特征融合,以结合全局语义与局部细节信息。传统方法(如Attention UNet)采用1×1卷积处理门控信号与输入特征,存在两方面局限:一是1×1卷积感受野小,难以捕捉较大范围的局部空间上下文,影响关键区域的特征聚焦;二是部分融合方案(如CASCADE)使用高成本卷积块,导致计算冗余,限制模型在资源受限场景的应用。

为解决上述问题,LGAG(Large-kernel Grouped Attention Gate,大核分组注意力门)模块被设计,核心目标是在降低计算成本的同时,通过大核分组卷积扩大感受野,更精准地捕捉局部空间关系,实现有效特征融合,提升精度。

2.2 结构

LGAG模块主要包含特征处理、归一化与激活、注意力系数生成、特征缩放四个核心环节,具体结构如下:

  1. 特征处理:针对来自跳接连接的门控信号(g)与上采样后的输入特征(x),分别应用3×3分组卷积(
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Limiiiing

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值