自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

魔改工程师的博客

零基础也能学会YOLO,轻松上手真不难!YOLO,simplified: Learn fast. Build faster.

  • 博客(105)
  • 收藏
  • 关注

原创 YOLOv11 改进 - 注意力机制 | Polarized Self-Attention 极化自注意力:高分辨率保持机制优化细节表征,助力小目标检测

本文介绍了极化自注意力(PSA)模块及其在YOLOv11中的结合应用。PSA模块旨在解决细粒度计算机视觉任务中的像素级回归问题,其融合了极化过滤和增强两个关键设计。极化过滤在通道和空间维度保持高分辨率,减少信息损失;增强采用细粒度回归输出分布的非线性函数。我们将PolarizedSelfAttention模块集成进YOLOv11,替换部分原有模块。实验结果表明,PSA能提升标准基线和最新技术的表现,在2D姿势估计和语义分割基准测试中效果显著,展现了其在目标检测领域的应用价值。

2025-11-24 23:09:14 484

原创 YOLOv11 改进 - 注意力机制 | LSKNet大型选择性核网络:自适应核加权强化关键特征捕获,增强小目标显著性

本文介绍了大型选择性核网络(LSKNet)及其在YOLOv11中的结合应用。LSKNet考虑遥感场景先验知识,能够动态调整大空间接收场,以模拟各种对象的范围上下文。它引入LSKblock Attention注意力机制,通过空间选择性机制动态调整感受野。其结构包含LSK module和LSK Block,通过大核卷积序列和空间选择机制,有效捕获长距离上下文信息。我们将LSKblockAttention模块集成进YOLOv11,替换部分原有模块。实验表明,LSKNet在多个检测基准测试中取得新的最优成绩,展现了

2025-11-24 23:07:27 727

原创 YOLOv11 改进 - 注意力机制 | CPCA(Channel prior convolutional attention)通道先验卷积注意力:轻量级设计破解权重分布难题,增强小目标显著性

本文介绍了通道先验卷积注意力(CPCA)机制及其在YOLOv11中的结合应用。CPCA结合通道注意力与空间注意力,通过多尺度深度可分离卷积模块,有效提取空间关系并保留通道先验。通道注意力学习各通道重要性,空间注意力捕捉特征图位置关系。我们将CPCA模块集成进YOLOv11,替换部分原有模块。实验表明,基于CPCA的CPCANet在医学图像分割任务中,用较少计算资源实现了优于先进算法的分割性能,展现了CPCA在目标检测领域的应用潜力。

2025-11-24 23:05:30 516

原创 YOLOv11 改进 - 注意力机制 | MCA 多维协作注意力:轻量化设计破解维度割裂难题,优化多尺度目标检测

本文介绍了多维协作注意力(MCA)机制及其在YOLOv11中的结合应用。MCA通过三个平行分支同时推断通道、高度和宽度维度的注意力,实现多维度协同注意力,且几乎无额外计算负担。其关键组成部分包括挤压变换和激励变换,挤压变换聚合特征,激励变换捕获局部特征交互。我们将MCALayer模块集成进YOLOv11,替换部分原有模块。实验表明,改进后的模型在数据集的图像识别任务中表现优越,超越其他先进方法,在性能和计算开销间取得良好平衡。

2025-11-24 23:03:26 622

原创 YOLOv11 改进 - 注意力机制 | PPA(Parallelized Patch-Aware Attention)并行补丁感知注意:分层特征融合保持小目标表征

本文介绍了用于红外小目标检测的深度学习方法HCF-Net及其在YOLOv11中的结合应用。HCF-Net采用升级版U-Net架构,包含PPA、DASI和MDCR三个关键模块。PPA模块利用分层特征融合和注意力机制,采用多分支特征提取策略,捕获不同尺度和级别的特征信息;DASI模块增强跳跃连接,实现高低维特征的自适应融合;MDCR模块通过深度可分离卷积捕获空间特征。我们将PPA模块集成进YOLOv11,替换部分原有模块。

2025-11-24 23:01:36 529

原创 YOLOv11 改进 - 注意力机制 | LS-YOLO MSFE 多尺度特征提取模块:并行分支结构增强多尺度感知,优化遥感与小目标检测

本文介绍了一种用于滑坡检测的模型LS-YOLO及其在YOLOv11中的结合应用。LS-YOLO首先构建多尺度滑坡数据集MSLD,为模型训练提供丰富数据。设计了基于高效通道注意力、平均池化和空间可分离卷积的多尺度特征提取模块MSFE,充分提取滑坡特征信息。在解耦头中采用膨胀卷积增加模型感受野。我们将MSFE模块集成进YOLOv11,替换部分原有模块。实验表明,改进后的YOLOv11在数据集中表现出色 。

2025-11-24 22:59:12 479

原创 YOLOv11 改进 - 注意力机制 | Sea_Attention 挤压增强轴向注意力:全局语义与局部细节协同增强,优化多尺度目标检测

本文介绍了压缩增强轴向变换器(SeaFormer)及其在YOLOv11中的应用。SeaFormer提出了Squeeze-enhanced Axial Attention注意力模块,结合全局语义提取和局部细节增强,通过水平和垂直方向的压缩操作降低时间复杂度至$O(HW)$,实现全局信息聚合与局部细节增强的平衡。我们将Sea_AttentionBlock模块引入YOLOv11,在检测头部分添加该模块。实验表明,改进后的YOLOv11在目标检测任务中能更有效地捕捉上下文信息,有望提升检测性能。

2025-11-24 20:26:46 535

原创 YOLOv11 改进 - 注意力机制 | Non-Local 非局部注意力:突破局部感受野限制,实现高效上下文信息整合

本文介绍了Non-local自注意力模型及其在YOLOv11中的应用。Non-local模型受非局部均值去噪滤波启发,通过计算任意两点间交互捕捉远程依赖,可作为组件集成到多种网络架构。该模型有高斯、嵌入式高斯、点积和连接四种实现模式,通过不同策略衡量特征点相似性。我们将Non-local模块引入YOLOv11,在骨干网络中添加该模块。实验表明,改进后的YOLOv11在目标检测任务中能更有效地捕捉上下文信息,有望提升检测性能。

2025-11-24 20:24:00 595

原创 YOLOv11 改进 - 注意力机制 | RCS-OSA减少通道的空间对象注意力:通道压缩与空间注意力协同破解特征冗余,增强多尺度感知

本文介绍了基于通道Shuffle重参数化卷积的YOLO新架构RCS-YOLO,及其核心模块RCS-OSA在YOLOv11中的集成。RCS-OSA结合了RepVGG/RepConv和ShuffleNet的优点,通过结构化重参数化和通道混洗优化卷积操作,训练时提供更多特征信息,推理时减少计算和内存消耗。我们将RCS-OSA模块引入YOLOv11,替换部分卷积层。实验表明,改进后的YOLOv11在速度和准确性超越了YOLOv6、YOLOv7和YOLOv8,体现了RCS-OSA模块的有效性。

2025-11-24 20:20:06 394

原创 YOLOv11 改进 - 注意力机制 | SGE(Spatial Group-wise Enhance)空间分组增强:分组注意力自主校准特征重要性,优化目标定位

本文介绍了Spatial Group-wise Enhance (SGE)模块及其在YOLOv11中的应用。SGE模块旨在增强卷积神经网络中的语义特征学习,通过全局和局部特征描述符的相似性引导注意力因子,调整子特征重要性,抑制噪声。该模块轻量级,几乎不增加额外参数和计算量。我们将SGE模块引入YOLOv11,在检测头部分的不同尺度特征图上应用。实验表明,改进后的YOLOv11在目标检测任务中表现良好,证明了SGE模块对提升模型性能的有效性。

2025-11-24 20:17:39 545

原创 YOLOv11 改进 - 注意力机制 | MLLAttention (Mamba-Like Linear Attention) 类Mamba线性注意力:动态感受野适配多尺度目标

本文介绍了Mamba-Like Linear Attention (MLLA)模型及其在YOLOv11中的集成。MLLA结合了Mamba和线性注意力Transformer的优点,线性注意力降低计算复杂度,Mamba有效建模序列。该模型将Mamba的遗忘门和块设计等关键元素与线性注意力结合,还可用位置编码替代遗忘门。我们将MLLA引入YOLOv11,在检测头的不同尺度特征图上应用。实验表明,改进后的YOLOv11在目标检测任务中表现良好,体现了MLLA在提升模型性能上的有效性。

2025-11-24 20:12:18 350

原创 YOLOv11 改进 - 注意力机制 | Gather-Excite 聚集-激发注意力:空间上下文聚合与重校准优化多尺度目标检测

本文介绍了Gather-Excite(GE)框架及其在YOLOv11中的应用。GE框架旨在增强卷积神经网络(CNNs)对上下文的利用能力,引入gather和excite操作符,解决传统CNN捕捉长距离依赖关系的局限性。gather操作符聚合特征响应,excite操作符重新分配信息。该框架轻量且易于整合到现有CNN架构中。我们将GE操作符引入YOLOv11,在检测头部分的不同尺度特征图上应用。实验表明,改进后的YOLOv11在目标检测任务中表现良好,证明了GE框架在提升模型性能方面的有效性。

2025-11-24 20:10:25 664

原创 YOLOv11 改进 - 注意力机制 | CAA上下文锚点注意力:条带卷积捕捉长程依赖,优化多尺度与长形目标检测

本文介绍了PKINet中的上下文锚点注意力模块(CAA)及其在YOLOv11中的应用。CAA模块旨在解决遥感图像目标检测中远程上下文信息不足的问题,通过局部特征提取、条带卷积和注意力机制,增强中心特征表达能力。该模块具有轻量化、特征增强和多尺度适应等优点。我们将CAA模块引入YOLOv11,在检测头部分的不同尺度特征图上应用该模块。实验表明,改进后的YOLOv11在目标检测任务中表现良好,证明了CAA模块在提升模型性能方面的有效性。

2025-11-24 20:07:23 568

原创 YOLOv11 改进 - 注意力机制 | Focused Linear Attention 聚焦线性注意力:增强特征聚焦与多样性,优化多尺度目标检测

本文介绍了Focused Linear Attention技术及其在YOLOv11中的集成。该技术旨在解决传统自注意力机制计算复杂的问题,通过引入映射函数提高焦点能力,利用秩恢复模块保持特征多样性,且具有线性复杂度。我们将Focused Linear Attention模块引入YOLOv11,在检测头部分的不同尺度特征图上应用该模块。通过实验训练改进后的模型,有望提升YOLOv11在目标检测任务中的性能。

2025-11-24 20:05:27 758

原创 YOLOv11 改进 - 注意力机制 | CascadedGroupAttention级联组注意力:动态感受野适配复杂场景,增强小目标特征捕获

本文介绍了EfficientViT模型中的Cascaded Group Attention(CGA)模块及其在YOLOv11中的应用。CGA受组卷积启发,通过为不同注意力头提供完整特征的分割,解决了传统自注意力机制计算冗余的问题,节省计算量并提高效率。该模块还具有改进注意力多样性、计算效率高和增加模型容量等优势。我们将CGA模块引入YOLOv11,在检测头部分的不同尺度特征图上应用该模块。通过实验训练改进后的模型,有望提升YOLOv11在目标检测任务中的性能。

2025-11-24 20:03:35 462

原创 YOLOv11 改进 - 注意力机制 | SENetV2 聚合稠密层:多分支密集层增强通道与全局表示,优化特征校准机制

本文介绍了图像分类模型SENetV2及其在YOLOv11中的应用。SENetV2结合了Squeeze-and-Excitation(SE)模块和密集层,通过提出Squeeze Aggregated Excitation(SaE)模块,增强了通道和全局特征表示能力,提高图像分类性能。我们将SENetV2的SaE模块引入YOLOv11,在检测头部分的不同尺度特征图上应用该模块。实验表明,改进后的YOLOv11在目标检测任务中表现良好,证明了SENetV2在提升模型性能方面的有效性。

2025-11-24 20:01:26 457

原创 YOLOv11 改进 - 注意力机制 | CBAM (Convolutional Block Attention Module) 卷积块注意力模块:轻量级设计自适应优化特征,提升小目标检测精度

本文介绍了卷积块注意力模块(CBAM)及其在YOLOv11中的集成。CBAM是一种用于CNN的注意力机制,通过依次在通道和空间维度推断注意力图,自适应优化输入特征图。该模块轻量通用,可无缝集成到任何CNN架构中。我们将CBAM引入YOLOv11,在检测头部分的不同尺度特征图上应用该模块。实验表明,改进后的YOLOv11在目标检测任务中表现良好,证明了CBAM在提升模型性能方面的有效性和广泛适用性。

2025-11-24 19:58:56 314

原创 YOLOv11 改进 - 注意力机制 | ParNet并行子网络:多分支协同优化特征表达,增强模型判别能

本文介绍了ParNet注意力机制及其在YOLOv11中的应用。ParNet注意力通过并行子网络结构,将网络层组织成多个子网络并行处理输入特征,降低了传统注意力机制在处理长序列时的计算复杂度。该机制采用VGG风格的块和特征融合策略,具有低深度高性能、参数效率高、可扩展性强和并行化能力好等创新点。我们将ParNet注意力引入YOLOv11,在检测头部分应用该机制。通过实验训练改进后的模型,有望提升YOLOv11在目标检测任务中的性能。

2025-11-24 19:56:31 658

原创 YOLOv11 改进 - 注意力机制 | GC Block(GlobalContext Block)全局上下文块:三重变换捕获全局依赖,提升复杂场景鲁棒性

本文介绍了全局上下文块(GC Block)及其在YOLOv11中的集成应用。GC Block是GCNet的核心组件,结合了NLNet和SENet的优势,通过上下文建模、特征变换和特征融合三个模块,高效捕获特征图中的全局依赖关系,在提高模型性能的同时降低计算成本。我们将GC Block引入YOLOv11,在检测头部分的不同尺度特征图上应用该模块。实验表明,改进后的YOLOv11在目标检测任务中表现良好,展现了GC Block在实际应用中的价值。

2025-11-24 19:54:21 556

原创 YOLOv11 改进 - 注意力机制 | Dual-ViT 双视觉变换器:双路径建模协同全局语义与局部特征,增强多尺度感知

本文介绍了双视觉Transformer(Dual-ViT)架构,并将其引入YOLOv11以降低自注意力机制的计算成本。Dual-ViT包含语义和像素两个路径,语义路径将token向量压缩为全局语义,像素路径利用该语义学习像素级细节,二者并行传播增强自注意力信息,在不显著降低准确性的情况下减少计算复杂度。实验表明,Dual-ViT在ImageNet等数据集上表现优异。我们将Dual-ViT相关代码集成进YOLOv11,经实验验证,改进后的YOLOv11在目标检测任务中展现出良好性能。

2025-11-24 19:49:29 610

原创 YOLOv11 改进 - 注意力机制 | HAT混合注意力变换器:超分重建能力迁移,提升小目标特征清晰度与检测精度

本文介绍了基于混合注意力的Transformer架构——HAT(Hybrid Attention Transformer),作为图像超分辨率领域的创新解决方案。该方法通过结合通道注意力和窗口自注意力机制,有效激活更多输入像素以获取更精细的重建效果。特别是新引入的重叠交叉注意力模块(OCAB)增强了相邻窗口特征间的信息交互,克服了传统Transformer模型窗口间信息隔离的限制。我们将HAT模块成功集成到YOLOv11的检测架构中,通过简单的接口替换原有特征提取模块,实现了注意力机制与目标检测的高效结合。

2025-11-23 22:38:34 436

原创 YOLOv11 改进 - 注意力机制 | ELA(Efficient Local Attention)高效局部注意力:突破降维限制精准定位,增强小目标感知

本文介绍了高效局部注意力(ELA)机制及其在YOLOv11中的结合。ELA旨在解决传统注意力机制在利用空间信息时的不足,通过“条带池化”提取空间信息,使用一维卷积和组归一化进行特征增强,生成空间注意力图,具有高效、轻量化和泛化能力强等优势。我们精心设计了三个超参数,形成四个不同版本以适应不同任务。将ELA集成进YOLOv11,在检测头部分引入该模块。实验表明,ELA在图像分类、目标检测和语义分割任务上优于现有方法。

2025-11-23 22:35:40 222

原创 YOLOv11 改进 - 注意力机制 | STA超级令牌注意力机制:超级令牌采样实现高效全局依赖捕获,优化多尺度感知

本文介绍了超级令牌注意力(STA)机制及其在YOLOv11中的结合。STA机制通过引入超级令牌,将原始标记聚合成有语义意义的单元,减少自注意力计算复杂度,提高全局信息捕获效率。它包括超级令牌采样、多头自注意力和标记上采样等步骤,实现全局与局部的高效信息交互。基于此,设计了层次化的视觉Transformer结构。我们将StokenAttention集成进YOLOv11的模型结构中,在骨干网络和检测头部分引入该模块。实验表明,该方法在图像分类、目标检测和语义分割等视觉任务上表现优异。

2025-11-23 22:33:50 657

原创 YOLOv11 改进 - 注意力机制 | Deformable-LKA 可变形大核注意力:自适应采样网格优化特征捕捉,提升不规则目标感知

本文介绍了可变形大核注意力(D-LKA Attention)及其在YOLOv11中的结合。D-LKA Attention是一种简化的注意力机制,采用大卷积核利用体积上下文信息,通过可变形卷积灵活调整采样网格,适应多样数据模式。它有2D和3D版本,3D版本在跨深度数据理解上表现出色,共同构成了D-LKA Net架构。我们将D-LKA Attention集成进YOLOv11,在模型的检测头部分引入deformable_LKA_Attention模块。实验表明,该方法在分割任务上表现优于现有方法,提升了模型的检测

2025-11-23 22:31:01 915

原创 YOLOv11改进 - C3k2融合 | C3k2融合加权卷积wConv2D:无损替换标准卷积,增强空间建模与特征提取质量

本文介绍了加权卷积及其在YOLOv11中的结合。加权卷积是一种新型卷积机制,通过引入密度函数,根据邻域像素与中心像素的距离自适应调整权重,打破传统卷积等权处理的局限。它在不增加可训练参数的情况下实现“距离感知”的特征提取,通过哈达玛积将密度函数与卷积核结合。其优化框架采用双优化器,分别对卷积核权重和密度函数进行优化。我们将加权卷积集成进YOLOv11的C3k2模块,形成C3k2_wConv2d。实验显示,与标准卷积相比,加权卷积显著降低了损失,降低了参数。

2025-11-23 22:27:23 274

原创 YOLOv11改进 - 卷积Conv | 加权卷积wConv:无损替换标准卷积,增强空间建模与特征提取质量

本文介绍了加权卷积wConv及其在YOLOv11中的结合。加权卷积是一种新型卷积机制,通过引入密度函数,根据邻域像素与中心像素的距离自适应调整权重,打破传统卷积等权处理的局限。它在不增加可训练参数的情况下实现“距离感知”特征提取,通过哈达玛积将密度函数与卷积核结合。其优化框架采用双优化器,分别对卷积核权重和密度函数进行优化。我们将加权卷积集成进YOLOv11,实验表明,与标准卷积相比,加权卷积能显著降低损失、提高测试准确率。

2025-11-23 22:15:30 684

原创 YOLOv11改进 - C3k2融合 | C3k2融合MBRConv 多分支重参数化卷积,MBRConv5*5用于浅层特征提取

本文介绍了超轻量化卷积神经网络(CNN)框架中的MBRConv相关模块及其在YOLOv11中的结合。为实现移动设备实时图像增强,该框架将重参数化与IWO策略结合,通过FST模块和HDPA机制提升性能。MBRConv是多分支重参数化卷积,有MBRConv3和MBRConv5两种变体,分别用于深层和浅层特征提取,能高效捕捉不同尺度特征。我们将MBRConv5集成进YOLOv11的C3k2模块,形成C3k2_MBRConv5,实验显示其有助于提升模型性能,适配移动设备资源约束。

2025-11-23 21:34:57 812

原创 YOLOv11改进 - C3k2融合 | C3k2融合MBRConv 多分支重参数化卷积,MBRConv3*3用于深层特征提取

本文介绍了MBRConv相关模块及其在YOLOv11中的结合。为实现移动设备实时图像增强,该框架将重参数化与IWO策略结合,通过FST模块和HDPA机制提升性能。MBRConv是多分支重参数化卷积,有MBRConv3和MBRConv5两种变体,分别用于深层和浅层特征提取,能高效捕捉不同尺度特征。我们将MBRConv3集成进YOLOv11的C3k2模块,形成C3k2_MBRConv3,实验显示其有助于提升模型性能。

2025-11-23 21:27:52 560

原创 YOLOv11改进 - 卷积Conv | AKConv可变核卷积:任意参数与采样形状赋能特征提取,提升检测精度

本文介绍了可改变核卷积(AKConv)及其在YOLOv11中的结合。传统卷积存在卷积窗口和核尺寸固定的缺陷,AKConv则使卷积核具有任意数量的参数和任意采样形状。它通过新的坐标生成算法定义卷积核初始位置,引入偏移量调整样本形状。AKConv具有卷积核灵活、初始采样位置生成算法创新、动态采样位置偏移、优化模型参数与计算效率等特点。我们将AKConv集成进YOLOv11,在多个代表性数据集的目标检测实验中,展示了其提升网络性能的优势。

2025-11-23 20:11:44 661

原创 YOLOv11改进 - 卷积Conv | DynamicConv动态卷积赋能YOLO,实现高效参数利用

本文介绍了ParameterNet及其核心的动态卷积技术在YOLOv11中的结合。动态卷积是一种卷积变体,通过条件生成卷积核,增强了CNN的表达和适应能力。ParameterNet方案旨在解决低FLOPs模型无法从大规模预训练受益的问题,利用动态卷积在增加参数数量的同时,将FLOPs增加最小化。复杂度分析表明,动态卷积参数量约为常规卷积的M倍,但计算量增加可忽略不计。我们将ParameterNet的动态卷积集成进YOLOv11,实验显示该方案具有优越性,能提升模型性能。

2025-11-23 20:09:05 721

原创 YOLOv11改进 - 卷积Conv | ODConv全维度动态卷积:四维注意力机制赋能特征提取,增强多尺度感知

本文介绍了全方位动态卷积(ODConv)及其在YOLOv11中的结合。现有动态卷积工作仅赋予卷积核一个维度动态属性,而ODConv利用新颖的多维注意力机制和并行策略,在卷积核空间的四个维度学习互补注意力。它可作为常规卷积的替代品插入多种CNN架构。我们将ODConv集成进YOLOv11,在 MS - COCO数据集上的实验表明,ODConv能带来显著的准确性提升,减少额外参数。

2025-11-23 20:06:29 425

原创 YOLOv11改进 - 卷积Conv | SAConv可切换空洞卷积:自适应融合多尺度特征,优化小目标与遮挡目标感知

本文介绍了Switchable Atrous Convolution(SAConv)及其在YOLOv11中的结合。SAConv是DetectoRS目标检测系统关键组件,将输入特征与不同空洞率卷积,用开关函数组合结果。空洞卷积可扩大滤波器视野,SAC能适应不同对象尺度,开关函数具有空间相关性。在宏观和微观层面分别采用递归特征金字塔和可切换空洞卷积,实现双重观察机制。我们将骨干网络中的标准卷积层转换为SAConv集成进YOLOv11,实验表明这显著提升了目标检测性能。

2025-11-23 20:00:06 599

原创 YOLOv11改进 - 卷积Conv | DualConv( Dual Convolutional):用于轻量级深度神经网络的双卷积核

本文介绍了一种用于构建轻量级深度神经网络的双卷积核(DualConv)方法及其在YOLOv11中的结合。DualConv结合$3 \times 3$和$1 \times 1$卷积核同时处理输入特征图通道,利用组卷积技术排列卷积滤波器。$3 \times 3$卷积核提取细粒度特征,$1 \times 1$卷积核压缩参数,组卷积减少计算量。该方法可应用于多种CNN模型。我们将DualConv集成进YOLOv11,实验表明它显著减少了计算成本和参数数量,提升了YOLO-V3检测速度和准确性,在部分数据集上还提高了

2025-11-23 19:55:21 467

原创 YOLOv11改进 - 卷积Conv | SPConv:基于分割的卷积巧解特征冗余,实现高效特征提取

本文介绍了一种基于分割的卷积操作SPConv及其在YOLOv11中的结合。传统卷积方法忽视了特征图中的模式冗余,SPConv将输入特征图分割为代表性部分和不确定冗余部分,分别采用 $k \times k$ 卷积和 $1 \times 1$ 卷积处理,并引入组卷积减少代表性部分冗余,还设计了无参数特征融合模块。SPConv可直接替代原始卷积。我们将其集成进YOLOv11,实验表明配备SPConv的网络在准确性、推理时间上优于基准模型,同时减少了浮点运算和参数量。

2025-11-23 19:52:15 653

原创 YOLOv11改进 - 卷积Conv | SCConv空间和通道重建卷积:轻量化设计助力复杂场景与小目标检测

本文介绍了一种名为SCConv的高效卷积模块及其在YOLOv11中的结合。传统CNN因卷积层提取冗余特征,计算资源消耗大。SCConv由空间重构单元(SRU)和通道重构单元(CRU)组成,是可直接替换标准卷积的即插即用架构单元。SRU采用“分离 - 重构”策略减少空间冗余,CRU运用“分割 - 转换 - 融合”策略减少通道冗余。我们将SCConv集成进YOLOv11,实验表明该方法在降低模型复杂性和计算成本的同时,提升了性能。

2025-11-23 19:48:19 336

原创 YOLOv11改进 - 卷积Conv | SPD-Conv空间深度转换卷积优化空间信息编码,攻克小目标检测难题

本文介绍了一种名为SPD-Conv的新型CNN构建块及其在YOLOv11中的结合。传统CNN在处理低分辨率图像或小物体时,因使用步长卷积和池化层导致细粒度信息丢失、性能下降。SPD-Conv由空间到深度(SPD)层和非步长卷积(Conv)层组成,完全消除卷积步长和池化层,避免信息损失。SPD层重排特征图元素将空间信息转换到深度维度,非步长卷积层进一步处理特征图。我们将SPD-Conv集成进YOLOv11,实验证明其在低分辨率图像和小物体检测任务上显著优于现有模型。

2025-11-23 19:27:11 605

原创 YOLOv11改进 - 卷积Conv | RFAConv:感受野注意力卷积动态调整感受野,提升小目标检出精度

本文介绍了感受野注意力卷积(RFAConv)及其在 YOLOv11 中的结合。空间注意力虽广泛应用但有局限,RFAConv 是将空间注意力与卷积操作融合的新型注意力机制,通过强化感受野空间特征关注、解决卷积核参数共享挑战、增强大尺寸卷积核处理能力等策略优化卷积核功能。它有基于 Group Conv 和 Unfold 两种实现方式,实验表明前者性能更好。我们将 RFAConv 集成进 YOLOv11,在数据集实验证明了方法优越性 。

2025-11-23 19:18:50 557

原创 YOLOv11改进 - 卷积Conv | 即插即用轻量化突破:OREPA在线卷积重参数化,通过动态结构演化实现高效特征提取与自适应优化

本文介绍了在线卷积重参数化(OREPA)及其在 YOLOv11 中的结合。结构重新参数化能在推理时优化模型性能,但训练成本高。OREPA 是两阶段流程,通过引入线性缩放层优化在线块,将复杂训练块压缩为单个卷积,减少训练开销。其包括块线性化和块压缩步骤,还探索了更有效的重参数化组件。与先进重参数化模型相比,OREPA 减少约 70%训练时间内存开销,加快约 2 倍训练速度,在 ImageNet 上表现提升最多 +0.6%。我们将 OREPA 集成进 YOLOv11,实验显示对下游任务有一致改进。

2025-11-23 19:06:26 475

原创 YOLOv11 改进 - 特征融合 | EFC增强层间特征相关性,通过多尺度特征交互减少冗余信息丢失即插即用

本文介绍了基于增强层间特征相关性(EFC)的轻量级融合策略及其在 YOLOv11 中的结合。检测无人机图像小物体具有挑战性,传统多尺度特征融合方法存在不足。EFC 模块通过引入分组的特征聚焦单元(GFF)增强特征关联性,利用多级特征重构模块(MFR)进行特征重构,减少冗余特征生成,且具有通用性和适应性。我们将 EFC 模块集成进 YOLOv11,替换部分特征融合策略。该方法即插即用,有望提升 YOLOv11 在小物体检测任务中的性能。

2025-11-23 00:26:49 839

原创 YOLOv11 改进 - 特征融合 | 融合Hyper-YOLO混合聚合网络MANet(Mixed Aggregation Network)通过多路径设计实现高效特征学习与模型适应性提升

本文介绍了新型目标检测方法 Hyper - YOLO 及其在 YOLOv11 中的结合。传统 YOLO 模型颈部设计有局限,为此提出超图计算驱动的语义收集与扩散框架(HGCSCS),将视觉特征图转化到语义空间并构建高阶信息传播机制。Hyper - YOLO 在主干网络引入混合聚合网络(MANet),结合多种卷积模块增强特征提取能力;在颈部网络设计基于超图的跨层级与跨位置表示网络(HyperC2Net)支持高阶交互。

2025-11-23 00:21:10 774

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除