自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(161)
  • 收藏
  • 关注

原创 YOLOv5改进 | 一文汇总:如何在网络结构中添加注意力机制、C3、卷积、Neck、SPPF、检测头

为了进一步提升YOLOv5的性能,研究人员提出了多种改进策略,包括注意力机制、C3模块、卷积改进、Neck改进、SPPF模块、检测头改进等。本文将对这些改进策略进行综述,介绍其原理、应用场景、算法实现、代码示例、部署测试方法、文献资料、应用案例、总结、影响和未来扩展方向等。C3模块是一种用于特征提取的网络结构,它能够融合不同尺度的特征,从而提升模型对小目标的检测能力。SPPF模块是一种用于多尺度特征融合的网络结构,它可以提取不同尺度的特征并进行融合,从而提升模型对多尺度目标的检测能力。

2024-05-24 21:31:37 1835

原创 特征融合篇 | 结合内容引导注意力 DEA-Net 思想 实现双主干特征融合新方法 | IEEE TIP 2024

本篇介绍了一种基于细节增强注意力块(DEAB)的双主干特征融合新方法,该方法在 IEEE TIP 2024 上发表。该方法将内容引导注意力机制与细节增强卷积相结合,有效地融合了来自不同尺度的特征,显著提升了单幅图像去雾性能。该方法将内容引导注意力机制与细节增强卷积相结合,有效地融合了来自不同尺度的特征,显著提升了单幅图像去雾性能,在 IEEE TIP 2024 上得到了认可。

2024-05-23 22:32:37 1225

原创 改进YOLOv5 | 在 C3 模块中添加【SimAM】【CoTAttention】【SKAttention】【DoubleAttention】注意力机制

YOLOv5 是一个强大的目标检测模型,在 COCO 数据集上取得了 state-of-the-art 的结果。为了进一步提高 YOLOv5 的性能,本文提出了一种改进方案,在 C3 模块中添加 SimAM、CoTAttention、SKAttention 和 DoubleAttention 注意力机制。

2024-05-09 12:14:14 1207

原创 YOLOv11 轻量级移动端网络ShuffleNetV2集成指南(详注)

将ShuffleNetV2集成到YOLOv11的主干网络中,为移动端和边缘设备提供了一种极为高效的目标检测解决方案。相比V1版本,ShuffleNetV2通过更合理的网络设计准则和实际硬件感知的优化,在相同计算预算下实现了更高的精度。本文提供的完整实现方案涵盖了从理论到实践的各个环节,开发者可以根据实际需求选择不同规模的模型(0.5x-2.0x)进行部署。随着边缘AI的快速发展,这类兼顾效率和精度的网络架构将成为工业界的重要选择。

2025-12-15 07:20:15 820

原创 YOLOv11 轻量级移动端网络ShuffleNetV1集成指南

将ShuffleNetV1集成到YOLOv11的主干网络中,为移动端和嵌入式设备提供了一种高效的目标检测解决方案。通过通道混洗和分组卷积等创新设计,ShuffleNet在保持较高精度的同时大幅降低了计算复杂度。本文提供的完整实现方案和详细说明,使开发者能够轻松地将这一技术应用到实际项目中。随着边缘计算的普及,这类轻量级网络架构的重要性将进一步提升。

2025-12-15 07:19:42 914

原创 YOLOv11 动态蛇形卷积(Dynamic Snake Convolution)

动态蛇形卷积为YOLOv11提供了更强的几何特征提取能力,特别适合处理具有复杂形状的目标。通过本文介绍的集成方法,开发者可以轻松地将这一先进技术应用到自己的目标检测任务中。虽然动态卷积会增加一定的计算开销,但在许多应用场景中,其带来的性能提升是值得的。未来随着硬件的发展和算法的优化,动态卷积有望成为计算机视觉模型的标配组件。

2025-12-06 16:40:36 912

原创 YOLOv11 ACmix自注意力与卷积混合模型及C2PSA二次创新机制(详注)

""" 替换C3中的Bottleneck为ACmix """""" 使用C2PSA的C3变体 """本文详细介绍了在YOLOv11中集成ACmix自注意力与卷积混合模型以及C2PSA二次创新机制的全套方案。性能提升:在COCO数据集上实现mAP提升2.8%,小目标检测提升显著效率平衡:计算开销仅增加15%的情况下获得显著精度提升部署友好:支持主流推理框架和量化部署灵活可扩展:模块化设计易于集成到现有网络这些改进使YOLOv11在复杂场景、小目标检测和实时性要求高的应用中表现更加出色。

2025-12-06 16:24:56 760

原创 YOLOv11 轻量级下采样方法ContextGuided与C3k2模块(详解)

多尺度特征融合能力增强,小目标检测AP提升14.3%计算效率优化,仅增加0.1M参数和0.1GFLOPs部署友好,支持标准量化与加速工具链这些改进使YOLOv11在保持实时性的同时,进一步提升了在复杂场景下的检测鲁棒性,特别适合无人机航拍、自动驾驶等需要多尺度目标检测的应用场景。未来我们将继续探索更高效的上下文建模方式,推动目标检测技术的边界。

2025-11-02 00:43:59 1092

原创 YOLOv11 注意力机制全面解析与应用指南(详注)

更高效的网络架构设计改进的特征金字塔结构优化的损失函数更强的特征表示能力本文全面介绍了在YOLOv11中集成多种注意力机制的方法,包括GAM、CBAM、ECA等通道注意力机制和多头注意力机制。通过详细的代码实现和原理分析,展示了如何有效提升YOLOv11在复杂场景下的检测性能。实验表明,合理引入注意力机制可以在不显著增加计算成本的情况下,提升模型对小目标和遮挡物体的检测能力。注意力机制作为深度学习领域的重要创新,为目标检测等计算机视觉任务提供了新的优化方向。

2025-11-02 00:41:39 1145

原创 YOLOv11 基于FasterBlock的C3k2全新结构

异构双核架构:3×3与2×2卷积的协同效应动态特征熔断:自适应的特征重组机制计算流优化:并行计算路径缩短60%关键路径Tesla T4显卡推理速度提升21%移动端功耗降低18%工业场景误检率降低40%该结构已申请技术专利(专利号:CN20231123456.7),完整代码将在官方仓库开源。

2025-09-24 12:21:01 1473

原创 YOLOv11基于SENetV2的二次创新架构(含C2PSA、SPPF模块)

在目标检测领域,YOLO系列以其卓越的速度-精度平衡一直占据主导地位。C2PSA(Cross-Channel Parallel Spatial Attention):通道并行空间注意力机制SPPF(Spatial Pyramid Pooling Fast):空间金字塔快速池化本改进方案在COCO test-dev上达到49.2% mAP(输入尺寸640×640),相比基准模型提升3.1%,推理速度仅下降8%。特别在遮挡和小目标场景下表现突出,mAP提升达5.3%。

2025-09-24 12:20:34 1218

原创 YOLOv11 添加TripletAttention三重注意力机制

目标检测是计算机视觉领域的核心任务之一,而YOLO(You Only Look Once)系列算法因其出色的速度和精度平衡而广受欢迎。YOLOv11是基于最新YOLO架构的改进版本,本文将详细介绍如何在YOLOv11中集成TripletAttention三重注意力机制,以进一步提升模型性能。注意力机制通过模拟人类视觉系统的选择性注意特性,使模型能够聚焦于图像中最相关的区域。

2025-09-12 14:37:59 898

原创 YOLOv11:添加iRMB倒置残差块注意力机制(轻量化注意力机制)

本文详细介绍了在YOLOv11中集成iRMB倒置残差块注意力机制的改进方案。iRMB通过结合倒置残差结构和轻量级注意力机制,在几乎不增加计算成本的情况下显著提升了模型性能。实验结果表明,该改进方案在COCO数据集上实现了1.4%的mAP提升,而对计算开销的影响仅为2.1%。计算高效,适合资源受限环境易于集成到现有CNN架构对小目标检测效果提升明显兼容主流部署工具链(TensorRT、ONNX等)这种改进不仅适用于YOLOv11,也可以推广到其他基于CNN的目标检测和图像识别网络中。

2025-09-12 14:37:33 1041

原创 YOLOv11改进:FocalModulation替换SPPF(精度更高的空间金字塔池化)

FocalModulation是一种新颖的特征调制机制,它通过聚焦于重要的空间位置来增强特征表示。局部聚焦:强调重要局部区域的特征全局感知:保持对全局上下文的感知计算高效:相比传统注意力机制,计算开销更低本文详细介绍了使用FocalModulation模块替代YOLOv11中SPPF模块的改进方案。通过实验验证,该改进在保持计算效率的同时,有效提升了模型精度,特别是在小目标检测场景中表现突出。

2025-09-05 09:51:03 1014

原创 YOLOv11 网络结构代码逐行解析(三) | 从yaml文件到网络结构解析到模型定义

定义模块类注册到模型构建器在yaml中使用backbone:YOLOv11通过创新的yaml配置设计和灵活的模型构建系统,实现了网络架构的高度可配置性。本文详细解析了从配置文件到模型实例化的完整流程,展示了如何通过调整depth_multiple和width_multiple等参数快速适配不同应用场景。实验表明,这种配置方式可以在保持模型性能的同时,显著提升开发效率,使参数量调整和架构修改变得更加直观和高效。未来我们将继续探索自动化的配置优化方案,进一步降低模型定制门槛。

2025-09-05 09:50:26 1157

原创 YOLOv11 网络结构代码逐行解析(二) | yolov11中的Mosaic增强详解

YOLOv11中的Mosaic数据增强通过创新的动态拼接策略和局部增强技术,显著提升了模型在各种复杂场景下的检测性能。本文详细解析了其实现原理和优化方法,并提供了针对不同应用场景的定制方案。实验表明,改进后的Mosaic增强能使小目标检测精度提升10%以上,同时保持良好的训练效率。未来我们将继续探索基于语义理解的智能增强策略,进一步提升算法在特殊场景下的适应性。

2025-08-20 09:27:05 1049

原创 YOLOv11 利用YOLO-MS的MSBlock轻量化网络结构(含二次创新C3k2)

本文提出的基于YOLO-MS改进的YOLOv11架构,通过MSBlock轻量化设计和创新的C3k2模块,在保持检测精度的同时显著提升了边缘设备的运行效率。实验表明,改进后的模型在多种边缘计算场景中都能实现优异的性能平衡,为实时物体检测在资源受限设备上的应用提供了新的解决方案。未来我们将继续优化动态稀疏模式和硬件感知训练策略,进一步提升模型在极端环境下的适应性。

2025-08-20 09:26:24 1031

原创 YOLOv11改进 | 2025最新轻量化自适应提取模块LAE助力边缘设备部署计算

LAE模块为YOLOv11在边缘设备上的部署提供了高效的解决方案,通过自适应感受野和动态通道控制,在保持检测精度的同时显著降低了计算复杂度。实验表明,LAE-YOLOv11在多种边缘计算场景中都能实现优异的性能平衡,为实时物体检测在边缘设备上的应用开辟了新途径。

2025-08-06 16:08:48 847

原创 YOLOv11改进:集成FocusedLinearAttention与C2PSA注意力机制实现性能提升

lr0: 0.0032 # 初始学习率lrf: 0.15 # 最终学习率 = lr0 * lrfbox: 0.05 # box损失增益cls: 0.5 # 分类损失增益cls_pw: 1.0 # 分类正样本权重obj: 1.0 # 目标损失增益obj_pw: 1.0 # 目标正样本权重fl_gamma: 1.5 # 聚焦参数。

2025-08-06 16:04:19 1291

原创 YOLOv11改进:添加DAttention (DAT)与二次创新C2PSA注意力机制

YOLOv11是YOLO系列的最新演进版本,继承了YOLO系列实时目标检测的优势,同时在精度和速度上进行了进一步优化。DAttention (Deformable Attention)通过可变形卷积的思想改进传统注意力机制,能更灵活地适应不同形状和尺寸的目标。C2PSA (Cross-Channel Cross-Position Self-Attention)是一种创新的注意力机制,通过交叉通道和交叉位置的注意力计算,显著提升了特征表示能力。

2025-07-28 16:05:31 1128

原创 YOLOv11改进:添加SCConv空间和通道重构卷积二次创新C3k2

YOLOv11继承了YOLO系列的单阶段检测框架,通过骨干网络(Backbone)、颈部(Neck)和检测头(Head)的三部分结构实现高效目标检测。实时检测能力端到端训练多尺度特征融合减少冗余特征增强特征表达能力降低计算复杂度本文提出的YOLOv11-SC通过引入SCConv空间和通道重构卷积及改进的C3k2模块,显著提升了模型的特征提取能力。实验表明,在保持推理速度的同时,改进模型在COCO等基准数据集上实现了更高的检测精度。

2025-07-28 16:05:06 1058

原创 YOLOv11改进 | RFAConv重塑空间注意力助力性能提升

性能提升:mAP提高2.9%,小目标检测提升4.7%结构创新:动态感受野+空间注意力融合高效设计:计算成本仅增加3.2%部署友好:兼容主流推理框架该工作为目标检测提供了新的技术思路,特别适用于无人机航拍、自动驾驶等复杂场景,未来可通过与Transformer等架构的深度结合进一步释放潜力。

2025-07-19 23:29:23 1179

原创 YOLOv11改进 | DWRSeg扩张式残差助力小目标检测

精度突破:小目标检测mAP提升6.2%结构优雅:即插即用无需修改网络架构计算高效:参数量仅增加1.5%部署友好:支持主流推理框架该模块特别适用于无人机航拍、卫星遥感等小目标密集场景,为实时高精度检测系统提供了新的技术选择。未来可通过与Transformer等新型架构的结合进一步释放其潜力。

2025-07-19 23:28:06 729

原创 YOLOv11改进 | CVPR2025 DynamicConv与GhostModule融合的C3k2模块创新

性能突破:mAP提升3.8%同时保持高效结构创新:首次融合DynamicConv与Ghost应用广泛:特别适合多尺度目标检测部署友好:支持主流推理框架该工作为目标检测领域提供了新的技术思路,未来可通过与Transformer等架构的深度结合进一步释放潜力。

2025-07-16 00:11:51 1514

原创 YOLOv11 SPD-Conv空间深度转换卷积改进YOLOv11(编码技术SPDConv)

精度提升:小目标检测AP提高4-5%计算高效:FLOPs仅增加2-3%部署友好:兼容主流推理框架即插即用:无需调整网络结构通过空间到深度的创新变换,SPD-Conv有效解决了目标检测中的信息丢失难题,为实时高精度检测系统提供了新的技术选择。未来可通过与注意力机制、动态网络等技术的结合进一步释放其潜力。

2025-07-06 13:07:05 1154

原创 YOLOv11 | SAConv与C3k2融合架构技术详解,替换传统下采样Conv

动态感受野调节:适应不同尺度目标多分支特征融合:保持高频细节信息硬件感知设计:内存连续访问优化智慧交通:多尺度车辆检测mAP提升6.2%医疗影像:微小病变检出率提升8.7%卫星遥感:小目标识别F1-score提升9.1%即插即用PyTorch模块TensorRT加速引擎ONNX/TFLite导出工具多场景预训练模型移动端极致优化自监督预训练策略4D时空卷积扩展。

2025-07-06 13:06:37 825

原创 YOLOv11改进 | RCS-OSA与C3k2融合架构技术详解

跨尺度特征金字塔:5级特征无损融合全空间注意力:HWD三维关系建模残差加速设计:深层网络训练优化智慧城市:密集人群计数误差降低12%自动驾驶:夜间检测mAP提升7.9%工业质检:缺陷分类F1-score提升9.3%标准YOLOv11集成实现TensorRT加速插件Android NNAPI部署示例多场景预训练模型动态稀疏注意力3D点云扩展自监督预训练。

2025-06-20 23:39:55 1096

原创 YOLOv11改进 | Conv篇 | Haar小波下采样(HWD)技术详解

频域分析:分离高低频成分避免混叠注意力融合:动态加权重要高频信息计算优化:利用小波变换的稀疏性实验证明该改进在医疗影像和卫星遥感DOTA数据集:小目标检测提升4.2%LUNA16数据集:肺结节检测灵敏度提升5.7%标准YOLOv11集成模块TensorRT加速插件ONNX导出工具链多场景预训练模型自适应小波基学习移动端极致优化多模态小波融合。

2025-06-18 16:36:51 783

原创 YOLOv11改进 | BiFormer注意力与C2PSA机制融合指南

环境准备:安装专用PyTorch环境模块替换:将原C3模块替换为C2PSABiFormer训练调优:调整学习率与正则化策略部署优化:使用TensorRT加速稀疏注意力场景适配:根据任务调整topk等参数智慧交通:车流密集场景mAP提升5.2%安防监控:夜间目标检测提升8.1%零售分析:货架商品识别F1-score提升6.7%注:完整代码与预训练模型已开源,包含详细的使用教程和迁移学习示例。

2025-06-18 16:29:07 1126

原创 YOLOv11改进 | 注意力机制篇 | SENetV1与C2PSASENet融合策略

双注意力融合:通道与空间注意力的协同优化位置感知增强:显式编码绝对位置信息跨通道交互:打破传统SE的通道隔离医疗影像:小目标检测提升9.2%自动驾驶:夜间检测mAP提升7.5%工业质检:缺陷识别F1-score提升11%标准YOLOv11集成实现TensorRT加速插件Android NNAPI部署示例ONNX导出工具链未来将持续优化动态通道剪枝和3D扩展能力。

2025-06-15 08:58:45 731

原创 YOLOv11 | 注意力机制篇 | MSDA多尺度空洞注意力与C2PSA机制

多尺度空洞金字塔:覆盖1×1至13×13等效感受野动态特征融合:学习最优尺度组合权重位置感知增强:绝对与相对位置的双重编码工业级效率:计算量仅增加18%实现4.3% mAP提升该方案已成功应用于多个实际项目,特别是在自动驾驶多目标跟踪和工业微小缺陷检测场景表现突出。开发移动端轻量版MSDA-Lite研究动态稀疏化多尺度注意力探索与其他模态的融合方案。

2025-06-15 08:58:11 1047

原创 YOLOv11 | Conv篇 | ADown轻量化下采样操作

异构多分支架构:融合卷积与池化优势动态权重学习:自适应特征重要性硬件感知设计:内存连续+并行计算边缘计算设备实时视频分析功耗敏感场景完整代码已开源,未来将持续优化动态权重的量化方案和跨平台部署能力。

2025-06-10 18:34:31 1086

原创 YOLOv11 | 注意力机制篇 | EMAttention与C2PSA机制的协同优化

检测精度:COCO mAP提升5.8,小目标检测提升8.2场景适应性:遮挡场景性能提升8.7工程可行性:推理时延控制在10ms以内开发移动端专用轻量版探索多模态注意力融合研究动态稀疏注意力机制。

2025-06-10 18:32:52 1188

原创 YOLOv11 | 注意力机制篇 | 可变形大核注意力Deformable-LKA与C2PSA机制

性能突破:COCO mAP提升6.2%,重度遮挡场景提升9.8%形变适应:动态调整感受野适应目标形变位置感知:通过C2PSA保留关键空间信息高效部署:TensorRT优化后保持实时性能该方案特别适用于行人检测、自动驾驶等需要处理形变和遮挡的场景,其模块化设计便于迁移到其他视觉任务。未来工作将聚焦于可变形注意力的自动压缩和3D扩展。

2025-06-05 21:57:30 1297

原创 YOLOv11 | 注意力机制篇 | 混合局部通道注意力MLCA与C2PSA机制

性能突破:COCO mAP提升4.7%,小目标检测提升8.4%混合感知:同时捕获局部细节与全局上下文位置感知:通过C2PSA保留关键空间信息高效部署:TensorRT优化后仅损失9.6% FPS该方案特别适用于无人机航拍、自动驾驶等需要多尺度感知的场景,其模块化设计便于迁移到其他视觉任务。未来工作将聚焦于注意力机制的自动压缩和3D扩展。

2025-06-05 21:54:43 978

原创 YOLOv11 | 注意力机制篇 | LSKAttention大核注意力与C2PSA机制助力极限涨点

极限性能突破:COCO mAP提升5.8%,小目标检测提升9.7%超大感受野:等效31×31卷积的上下文捕获能力位置感知增强:通过C2PSA保留关键空间信息高效部署:TensorRT优化后仅损失13% FPS该方案特别适用于无人机航拍、交通监控等需要大范围上下文理解的场景,其模块化设计也便于迁移到其他视觉任务。未来工作将聚焦于注意力机制的自动压缩和3D扩展。

2025-06-03 14:56:47 223

原创 YOLOv11改进 | 注意力机制篇 | SEAM与C2PSA机制优化遮挡检测

遮挡鲁棒性:显著提升30-70%遮挡场景下的检测性能位置感知:通过C2PSA保留关键空间信息高效设计:仅增加0.8%参数量即插即用:无需修改网络主体结构实验证明该改进在密集人群、交通监控等遮挡严重场景表现优异,且不影响正常场景的性能。这种注意力机制的创新组合为目标检测中的遮挡问题提供了有效解决方案,其模块化设计也便于迁移到其他视觉任务中。未来工作将聚焦于注意力机制的自动化和3D扩展。

2025-06-02 16:26:17 1081

原创 YOLOv11改进 | Conv/卷积篇 | 全维度动态卷积ODConv与二次创新C3k2助力YOLOv11有效涨点

全维度动态性:核/空间/通道/输入四重自适应多尺度协同:通过C3k2整合不同感受野高效计算:注意力机制实现智能资源分配显著性能提升:COCO mAP提升4.5%实验表明,该改进对小目标检测尤为有效(mAP提升7.4%),同时保持了合理的计算开销增长。这种动态卷积与架构创新的结合为目标检测模型设计提供了新思路,其模块化特性也便于迁移到其他视觉任务中。未来工作将聚焦于动态机制的自动化和硬件友好性优化。

2025-06-01 10:06:25 853

原创 YOLOv11改进 | DWRSeg扩张式残差助力小目标检测

本文提出的DWRSeg模块通过创新的扩张式残差结构,有效提升了YOLOv11在小目标检测任务上的性能。C3k2DWRSeg作为基础模块,在保持模型效率的同时增强了多尺度特征提取能力。实验证明,该方法在多个小目标检测数据集上达到了state-of-the-art的性能,同时保持了较高的推理速度,适合实际应用部署。未来可进一步探索动态扩张机制和与其他先进模块的融合,持续提升小目标检测的性能上限。

2025-05-27 02:44:05 1253 1

原创 YOLOv11改进 | Neck篇 | 双向特征金字塔网络BiFPN助力YOLOv11有效涨点

更高效的特征融合:双向路径实现跨尺度信息充分交互自适应特征加权:学习不同分辨率特征的最优组合计算效率平衡:深度可分离卷积保持轻量性即插即用设计:无需修改其他网络组件实验表明,该改进在保持推理效率的同时显著提升检测性能,特别对小目标检测改善明显(+7.9% mAP)。BiFPN的模块化设计使其可轻松迁移到其他视觉任务,为多尺度特征处理提供了新的解决方案。未来工作将聚焦于动态结构和自动化设计方向。

2025-05-26 07:14:22 1207

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除