不会学AI
菜鸡一只,正在努力。
展开
-
YOLOv10改进系列 ---- Conv篇 ---- SAConv空洞卷积
本文给大家带来的改进机制是可切换的空洞卷积SAC)是一种创新的卷积网络机制,专为增强物体检测和分割任务中的特征提取而设计。SAC的核心思想是在相同的输入特征上应用不同的空洞率进行卷积,并通过特别设计的开关函数来融合这些不同卷积的结果。这种方法使得网络能够更灵活地适应不同尺度的特征,从而更准确地识别和分割图像中的物体。可切换的空洞卷积的基本原理和框架,能够在你自己的网络结构中进行添加(值得一提的是一个SAConv大概可以降低0.3GFLOPs)。原创 2025-02-21 22:23:04 · 1022 阅读 · 0 评论 -
YOLOv10改进系列 ---- Conv篇 ---- RCS-OSA替换C2f实现快速涨点
本文给大家带来的改进机制是RCS-YOLO提出的RCS-OSA模块,其全称是"Reduced Channel Spatial Object Attention",意即"减少通道的空间对象注意力这个模块的主要功能是通过减少特征图的通道数量,同时关注空间维度上的重要特征,来提高模型的处理效率和检测精度。亲测在小目标检测和大尺度目标检测的数据集上都有大幅度的涨点效果(mAP直接涨了大概有0.6左右。原创 2025-02-21 22:07:03 · 1054 阅读 · 0 评论 -
YOLOv10改进系列 ---- Conv篇 ---- ODConv卷积助力极限涨点
这篇文章给大家带来的是发表于2022年的ODConv(Omni-Dimensional Dynamic Convolution)中文名字全维度动态卷积,该卷积可以即插即用,可以直接替换网络结构中的任何一个卷积模块,在本文的末尾提供可以直接替换卷积模块的ODConv,添加ODConv模块的C2f和Bottleneck(配合教程将代码复制粘贴到你自己的代码中即可运行)给大家,该卷积模块主要具有更小的计算量和更高的精度,其中添加ODConv。原创 2025-02-20 21:53:37 · 1313 阅读 · 0 评论 -
YOLOv10改进系列 ---- Conv篇 ---- DWRSeg扩张式残差助力小目标检测
本文内容给大家带来的DWRSeg中的DWR模块来改进YOLOv10中的C2f和Bottleneck模块,主要针对的是小目标检测多尺度特征提取机制的深入研究和创新的DWR模块和SIR模块的提出,这种方法使得网络能够更灵活地适应不同尺度的特征,从而更准确地识别和分割图像中的物体。通过本文你能够了解到:DWRSeg的基本原理和框架,并且能够在你自己的网络结构中进行添加(DWRSeg需要增加一定的计算量一个DWR模块大概增加0.4GFLOPs)。原创 2025-02-20 21:27:49 · 1064 阅读 · 0 评论 -
YOLOv10改进系列 ---- Conv篇 ---- CVPR2024最新DynamicConv替换下采样
本文给大家带来的改进机制是CVPR2024的最新改进机制其是CVPR2024的最新改进机制,这个论文中介绍了一个名为ParameterNet的新型设计原则它旨在在大规模视觉预训练模型中增加参数数量,同时尽量不增加浮点运算(FLOPs),所以本文的DynamicConv被提出来了,使得网络在保持低FLOPs的同时增加参数量,从而允许这些网络从大规模视觉预训练中获益,下面的图片为V10n和利用了DynamicConv的训练精度对比图,本文内容包含详细教程 + 代码 + 原理介绍。原创 2025-02-19 21:09:11 · 1189 阅读 · 0 评论 -
YOLOv10改进系列 ---- Conv篇 ---- 2024利用 Haar 小波的下采样HWD替换传统下采样
本文给大家带来的改进机制是Haar 小波的下采样HWD替换传统下采样(改变YOLO传统的Conv下采样)在小波变换中,Haar小波作为一种基本的小波函数,用于将图像数据分解为多个层次的近似和细节信息,这是一种多分辨率的分析方法。我将其用在YOLOv11上其明显降低参数和GFLOPs在V11n上使用该机制后参数量为220W计算量GFLOPs为5.5(轻量化效果十分明显)。官方论文地址:官方论文地址点击此处即可跳转(论文需要花钱此论文)官方代码地址:官方代码地址点击此处即可跳转论文介绍了一种基于Haar。原创 2025-02-19 20:52:40 · 979 阅读 · 0 评论 -
YOLOv10改进系列 ---- Conv篇 ---- 2024.1月最新成果可变形卷积DCNv4(适用检测、Seg、分类、Pose、OBB)
本文给大家带来的改进机制是2024-1月的最新成果DCNv4,其是DCNv3的升级版本,效果可以说是在目前的卷积中名列前茅了,同时该卷积具有轻量化的效果!一个DCNv4参数量下降越15Wparameters左右,。它主要通过两个方面对前一版本DCNv3进行改进:首先,它移除了空间聚合中的softmax归一化,这样做增强了其动态特性和表达能力;其次,它优化了内存访问过程,以减少冗余操作,从而加快处理速度。DCNv4的表现可以说是非常的全面,同时该网络为新发目前存在大量使用Bug我均已修复。原创 2025-02-18 20:11:58 · 3427 阅读 · 0 评论 -
YOLOv10改进 | 代码逐行解析(四) | 手把手带你理解YOLOv10的一对一和一对多检测头(新手入门必读系列)
本文给大家带来的是YOLOv10中从检测头结构分析到损失函数各种计算的详解,本文将从检测头的网络结构讲起,同时分析其中的原理(包括代码和网络结构图对比),最重要的是分析检测头的输出,因为检测头的输出是需要输出给损失函数的计算不同阶段的输出不一样所以我们在讲损失函数计算的时候需要先明白检测头的输出和其中的一些参数的定义,本文内容为我独家整理和分析,手打每一行的代码分析并包含各种举例分析对于小白来说绝对有所收获,全文共1万1千字。原创 2025-02-18 19:35:56 · 1688 阅读 · 0 评论 -
YOLOv10改进 | 代码逐行解析(三) | YOLO中的Mosaic增强详解(新手入门必读系列)
本文给大家带来的是YOLOv10中的Mosaic增强代码的详解,可能有部分人对于这一部分比较陌生,有的读者可能知道Mosaic增强但是不知道其工作原理,具体来说Mosaic增强就是指我们的数据集中的图片在输入给模型之前的一个处理过程(我们的图片并不是直接就输入给模型了,大家的训练结果中的结果检测图片大家可以看到数据集中多个图片会组合在一起这就是简单的Mosaic增强),下面我就来讲解一下其在YOLOv10中工作原理和代码定义,下面图片为一个Mosaic增强后的图片。原创 2025-02-17 20:18:28 · 1698 阅读 · 0 评论 -
YOLOv10改进 | 代码逐行解析(二) | 从yaml文件到模型定义(新手入门必读系列)
本文给大家带来的是YOLOv10项目的解读,之前给大家分析了YOLOv10的项目文件分析,这一篇文章给大家带来的是模型训练从我们的yaml文件定义到模型的定义部分的讲解,我们一般只知道如何去训练模型,和配置yaml文件,但是对于yaml文件是如何输入到模型里,模型如何将yaml文件解析出来的确是不知道的,本文的内容接上一篇的代码逐行解析(一) 项目目录分析,本文对于小白来说非常友好,非常推荐大家进行阅读,深度的了解模型的工作原理已经流程,下面我们从yaml文件来讲解。原创 2025-02-17 19:44:08 · 925 阅读 · 0 评论 -
YOLOv10改进 | 代码逐行解析(一) | 项目目录构造分析(新手入门必读系列)
Hello,大家好这次给大家带来的不是改进,是整个YOLOv10项目的分析整个系列大概会更新7-10篇左右的文章,从项目的目录到每一个功能代码的都会进行详细的讲解,下面开始进行YOLOv10逐行解析的第一篇——项目目录构造分析开头之前顺便给大家推荐一下我的专栏,本专栏更新上百余篇YOLOv10改进机制,手把手教你添加到网络结构中,同时针对拿到模型不知道如何修改,不知道如何发表论文的读者进行针对性的文章介绍,本专栏质量分平均分98分,内容质量完全有所保证。原创 2025-01-21 19:04:48 · 1253 阅读 · 0 评论 -
YOLOv10 | 教你利用yolov10训练自己数据集(含环境搭建、参数解析 、数据集查找、模型训练、推理、导出)
YOLO通常利用带有步幅2的常规3×3标准卷积,同时实现空间下采样(从H×W到H/2×W/2)和通道变换(从C到2C)。这引入了不可忽视的计算成本和参数数量相反,我们提出分离空间减少和通道增加操作,进行更高效的下采样。具体而言,我们首先利用点卷积调整通道维度,然后利用深度卷积进行空间下采样。这将计算成本减少到和参数数量减少到。同时,这最大限度地保留了下采样过程中的信息,从而在减少延迟的同时实现竞争性性能。YOLO通常为所有阶段使用相同的基本构建块,例如YOLOv8中的瓶颈块。原创 2025-01-20 20:12:11 · 1166 阅读 · 0 评论