拿下Nahida-优快云博客

原创【纯干货级教程】YOLOv7如何添加注意力机制？

注意力机制（Attention Mechanism）是一种在机器学习和深度学习中广泛使用的方法，它用于模仿人类大脑如何聚焦于特定信息并忽略其他不相关信息。本文以YOLOv7为示例介绍如何添加注意力机制。

2024-08-14 00:28:52 2041

原创【纯干货级教程】深度学习根据loss曲线进行分析调参

以YOLOv5/YOLOv7示例展示深度学习的目标检测算法在输出的文件中的loss曲线变化规律的一般情况的分析总结，并用以调整自己的模型、调参等。

2024-06-16 08:00:00 12920 12

原创简述图像预处理过程中图像噪声的种类、去噪方法、代码等

本文简述常见的图像噪声种类、场景以及对应代码，解决之策，并给出效果图展示。

2024-12-29 19:52:11 1722

原创【零基础保姆级教程】制作自己的数据集——Labelme的安装与使用及常见的报错解决方法

介绍labelme的安装、使用完整流程，进行多边形标注以创建自己的语义分割数据集。

2024-12-24 18:15:48 1205 2

原创【零基础保姆级教程】制作自己的数据集——Labelimg的安装与使用及常见的报错解决方法

labelimg是应用于目标检测的手动标注工具，英文版，可生成yolo格式、voc、CreatML标签格式的目标检测数据集。本文介绍如何使用以及进行训练、常见问题。

2024-12-22 22:24:22 1490 1

原创【零基础保姆级教程】MMDetection3安装与训练自己的数据集

最近在跑目标检测对比试验，由于MMDetection框架的算法较齐全，遂决定写一篇教程留做参考。本文系统性完整阐述了如何简单地跑通项目流程，与部分错误解决、数据集生成、如何输出precision、recall、f1分数和将其保存。

2024-10-02 13:12:32 1663 3

原创【持续更新中】MMDetection3训练自己的数据集常见报错解决

博主近来跑自己数据集需要对比试验，故选择了MMDetection3这一算法整合详细的框架，遇到了较多问题在此处留作记录，若你也有相应的问题可以在评论区提出与解决方法。会持续更新，同时欢迎批评指正。

2024-10-02 13:10:57 1423

原创【零基础保姆级教程】MMDetection3训练输出Precision/Recall/F1-Score指标

最近为了跑对比试验，MMDetection这一框架整合的算法较多，故博主训练它并留下记录，若有疑问等欢迎评论、指正。本文能够输出单个或所有epoch的指标，供给有需要的小伙伴观看。

2024-10-02 12:29:08 1393

原创【YOLOv5/v7改进系列】替换Neck为Gold-Yolo特征融合网络

Gold-YOLO是一种高效的物体检测模型，它通过一种新的机制——Gather-and-Distribute（GD）机制来增强多尺度特征融合的能力，从而在保证实时性能的同时提高了检测精度。

2024-08-14 13:52:05 1608 2

原创【零基础保姆级教程】mmcv安装教程

mmcv这个库比较难安装，但在进行深度学习工作的时候却又很难避开，若是没有安装conda环境和CUDA环境的尤其难安装，若大家有遇到mmcv安装上的问题，可按照本文的步骤一步步安装即可解决。

2024-08-09 00:37:14 11257 2

原创【YOLOv5/v7改进系列】引入ContextAggregation注意力机制

提出了一个名为CONTAINER（CONText AggregatIon NEtwoRk）的新架构，这是一种通用的多头上下文聚合块，能够有效地融合局部和全局信息，并展示了在图像分类和下游任务中的出色性能。

2024-08-05 15:09:32 1573

原创【YOLOv5/v7改进系列】引入卷积块注意力模块CBAM注意力机制

提出了一种名为卷积块注意力模块（Convolutional Block Attention Module, CBAM）的技术，这是一种简单而有效的注意力机制，可以集成到现有的卷积神经网络（CNN）架构中以提升性能。下面是该技术的一些优点和潜在的局限性或缺点。

2024-08-02 12:39:40 1623

原创【YOLOv5/v7改进系列】引入YOLOv9的RepNCSPELAN4

YOLOv9的几个主要创新点：Programmable Gradient Information (PGI):PGI是一种机制，用于应对深度网络中实现多目标所需要的多种变化。PGI提供完整的输入信息来计算目标函数，从而获得可靠的梯度信息以更新网络权重。PGI可以自由选择适合目标任务的损失函数，克服了掩模建模遇到的问题。PGI机制适用于不同大小的深度神经网络，并且比仅适用于非常深的神经网络的深度监督机制更为通用。Generalized Efficient Layer Aggregation Ne

2024-07-29 22:56:50 1940

原创【YOLOv5/v7改进系列】引入中心化特征金字塔的EVC模块

为了解决这个问题，作者提出了CFP，它首先在最深层的特征图上应用显式视觉中心方案，然后利用这些信息去调整较浅层的特征图。完成二后，在YOLOv7项目文件下的models文件夹下创建新的文件yolov7-tiny-evc.yaml，导入如下代码。完成二后，在YOLOv5项目文件下的models文件夹下创建新的文件yolov5s-evc.yaml，导入如下代码。完成二后，在YOLOv5项目文件下的models文件夹下创建新的文件yolov5n-evc.yaml，导入如下代码。运行后打印如上代码说明改进成功。

2024-07-26 20:26:27 1989

原创【YOLOv5/v7改进系列】引入CoordConv——坐标卷积

优点：创新性：提出了一个新颖的问题，即CNN在学习从坐标空间到像素空间的映射时存在显著的缺陷。CoordConv的概念为CNN提供了一个简单的补救措施，通过额外的坐标通道使卷积层能够访问其输入坐标。实证研究：作者通过一系列实验展示了CNN在处理坐标变换问题上的局限性，以及CoordConv如何解决这些问题。展示了CoordConv在不同任务上（如GAN、Faster R-CNN、Atari游戏）的性能提升，这表明其适用范围广泛。效率与性能：CoordConv模型不仅在训练速度上远超传统CN

2024-07-22 21:34:43 1579

原创【YOLOv5/v7改进系列】引入SAConv——可切换空洞卷积

SAConv,DetectoRS 在COCO测试集上取得了非常优秀的检测、实例分割和全景分割性能，例如达到55.7%的边界框平均精度（box AP）和48.5%的掩模平均精度（mask AP），以及50.0%的全景质量分数（PQ）。这有助于增强对物体的识别能力。：虽然DetectoRS提供了卓越的性能，但增加的递归和多尺度处理可能需要更多的计算资源和更长的训练时间，这可能限制了其在资源受限环境中的应用。：由于模型引入了递归和可切换的组件，模型的复杂度有所增加，这可能影响模型的实时性和部署成本。

2024-07-19 20:58:20 1697

原创【YOLOv5/v7改进系列】改进池化层为YOLOv9的SPPELAN

通过这些优点，SPPELAN模块能够增强YOLOv9在物体检测任务中的表现，特别是在处理包含多种尺度目标的复杂场景时。完成二后，在YOLOv7项目文件下的models文件夹下创建新的文件yolov7-tiny-sppelan.yaml，导入如下代码。完成二后，在YOLOv5项目文件下的models文件夹下创建新的文件yolov5s-sppelan.yaml，导入如下代码。完成二后，在YOLOv5项目文件下的models文件夹下创建新的文件yolov5n-sppelan.yaml，导入如下代码。

2024-07-16 00:51:48 1438 1

原创【YOLOv5/v7改进系列】改进池化层为SimSPPF

在YOLOv6的不同变体中（如YOLOv6-N/S/M），SimSPPF可以根据模型的大小和特定需求进行调整，例如在较小的模型中使用SimCSPSPPF以进一步加速，而在较大的模型中使用SimSPPF以保持良好的精度。总体而言，SimSPPF模块是YOLOv6设计中为了平衡速度和精度而做出的一种选择，它通过牺牲一定的复杂性和理论上的精度，换取了实际应用中的高效率和快速响应。

2024-07-12 12:43:08 1930

原创【YOLOv5/v7改进系列】改进池化层为RFB

RFB模块的设计是手工制作的，这意味着它可能不如自适应机制灵活，例如可变形卷积神经网络中使用的那些，后者可以根据对象的尺度和形状调整感受野的分布。分支的内核大小、填充和扩张率各不相同，目的是捕捉不同尺度的信息。: RFB模块利用多个分支，每个分支有不同的卷积核大小和空洞卷积层，这有助于捕捉图像中不同尺度的信息，类似于人类视觉系统中感受野的多样性。: RFB模块通过模拟人类视觉系统中感受野的大小和偏心率之间的关系，增强了轻量级CNN网络的特征表示，从而提高了特征的区分性和鲁棒性。构造函数接收输入通道数。

2024-07-08 11:30:45 2022

原创【YOLOv5/v7改进系列】改进池化层为ASPP

【YOLOv5/v7改进系列】改进池化层为ASPP。Atrous Spatial Pyramid Pooling (ASPP)模块是一种用于多尺度特征提取的创新技术，旨在提升深度学习模型在语义图像分割任务中的表现。ASPP模块通过在不同的采样率下应用空洞卷积，可以捕获不同大小的对象以及图像的上下文信息，从而增强模型在处理不同尺度物体时的鲁棒性。

2024-07-05 18:55:05 1823

原创【YOLOv5/v7改进系列】替换损失函数为WIOU、CIOU、GIOU、SIOU、DIOU、EIOU、Focal C/G/S/D/EIOU等

YOLOv5/YOLOv7改进更换损失函数为CIOU、GIOU、SIOU、DIOU、EIOU、WIOUv1/v2/v3、Focal C/G/S/D/EIOU等

2024-07-01 18:21:25 1994

原创【YOLOv5/v7改进系列】引入RT-DETR的RepC3

在COCO数据集上，RT-DETR-R50和RT-DETR-R101分别达到了53.1%和54.3%的平均精度（AP），同时在T4 GPU上分别实现了108和74的帧每秒（FPS）。：经过Objects365数据集的预训练后，RT-DETR-R50和RT-DETR-R101的性能进一步提升至55.3%和56.2%的AP，显示了巨大的性能提升潜力。综上，RT-DETR通过其创新的设计，在保证实时性的前提下，实现了速度与准确性的优化，为实时目标检测领域带来了一种新的、性能优越的解决方案。

2024-06-28 07:00:00 3205

原创【YOLOv5/v7改进系列】引入PConv——轻量快速的卷积块

基于PConv，文章进一步设计了名为FasterNet的新家族神经网络，这些网络在多种设备上实现了显著的运行速度提升，同时保持了在不同视觉任务上的准确性。大型的FasterNet-L在保持与Swin-B相当的高精度（83.5%）的同时，GPU上的推理吞吐量提高了36%，CPU上的计算时间节省了37%。作者发现，问题的核心在于较低的每秒浮点运算次数(FLOPS)，这主要是由于操作过程中频繁的内存访问，尤其是深度卷积(DWConv)带来的影响。

2024-06-25 01:17:03 4024

原创【YOLOv5/v7改进系列】引入特征融合网络——ASFYOLO

【YOLOv5/v7改进系列】引入特征融合网络——ASFYOLO。实验验证显示，ASF-YOLO模型在两个细胞数据集上取得了显著的分割精度和速度，包括在2018年数据科学碗数据集上的框mAP为0.91，掩码mAP为0.887，推理速度为47.3 FPS，优于当时最先进的方法。

2024-06-21 10:19:27 2781 3

原创【YOLOv5/v7改进系列】改进池化层为RT-DETR的AIFI

在yolov5/yolov7-tiny引入了rt-detr的aifi模块，它具有更高的性能和更少的参数。

2024-06-14 18:25:48 1830

原创【YOLOv5/v7改进系列】改进池化层为SPP、SPPF、SPPCSPC

池化层（Pooling Layer）是卷积神经网络（Convolutional Neural Networks, CNNs）中的一个重要组成部分，主要用于减少输入数据的空间尺寸（例如，图像的宽度和高度），同时保持其最重要的信息。这一过程称为下采样（downsampling）或者降维。池化操作通过提取特征图（feature maps）的摘要信息来实现，这些摘要信息通常是原特征的统计量，如最大值、平均值或其他聚合方式的结果。

2024-06-08 08:00:00 3050

原创【YOLOv7改进系列】简化YOLOv7-tiny池化层，便于引入改进的池化层

相比YOLOv5/v7，除了YOLOv5n外，YOLOv7tiny的参数量较小，效果往往也相较YOLOv5n高上不少，又近来博主打算改进yolov7-tiny文件，但苦于其池化层部位是直接写在yaml中的，修改极为不便，因此对池化层做简化处理。本次修改的目标是将yaml中池化层的代码修改为单层代码形式来代表，便于以后做替换、改进工作，因此，需要保证改进前后的参数量、GFLOPS相同。此外，可能有小伙伴会疑问，为何博主不推荐把所有部位都简化？这是因为某些修改常常会修改于1x1的卷积，而不修改3x3的卷积。

2024-06-08 00:42:49 1730

原创【YOLOv5/v7改进系列】替换上采样层为Dysample

与基于核的早期动态上采样器相比，DySample无需定制CUDA包，参数量、FLOPs、GPU内存和延迟都大幅减少。它不仅具有轻量化特性，在语义分割、对象检测、实例分割、全景分割和单目深度估计等五项密集预测任务中，性能也优于其他上采样方法。

2024-06-07 08:00:00 2645 18

原创【YOLOv5/v7改进系列】引入Slim Neck与GSConv

文章还提出了一种设计范式“slim-neck”，即仅在模型的“neck”部分使用GSConv，而非整个模型。：特别是在“细颈”(slim-neck)设计范式中，GSConv被应用于模型的中间连接部分，即neck，这时特征图已经过初步处理，变得较为精简，且宽度和高度减小到最小，而通道数达到最大。综上所述，GSConv通过创新的结构设计为轻量级目标检测模型提供了新的解决方案，尤其在自动驾驶领域，它能够帮助模型在保持高效运行的同时，提高对小目标的检测精度，但其应用也需考虑模型复杂度增加和实现上的局限性。

2024-06-04 02:02:03 1825

原创【YOLOv5/v7改进系列】引入ODConv——即插即用的卷积块

ODConv作为标准卷积的直接替代品，可以方便地集成到多种CNN架构中，不仅适用于轻量级网络，也包括大型网络，如ResNet101，并且在这些网络上显示出有前景的结果，如为ResNet101带来1.57%的top-1精度增益。研究发现，ODConv学习到的四种注意力（空间注意力αsi、通道注意力αci、滤波器注意力αfi、权重注意力αwi）是互补的，它们共同作用能有效解决单个注意力机制可能忽视的问题，提高了模型的决策能力。与参考方法相比，相同模型尺寸下，ODConv的训练成本更高。

2024-05-31 08:00:00 1968

原创【YOLOv5/v7改进系列】引入AKConv——即插即用的卷积块

AKConv提出了一种新的卷积方式，旨在提升卷积神经网络的灵活性和效率，尤其是在处理非规则目标和减小模型复杂性方面展现出了潜力，但同时也带来了实施和训练上的挑战。

2024-05-29 17:42:50 1812 2

原创【YOLOv5/v7改进系列】替换激活函数为SiLU、ReLU、LeakyReLU、FReLU、PReLU、Hardswish、Mish、ELU等

激活函数不仅决定了神经网络的学习能力，还在很大程度上影响了目标检测模型的精度、训练效率以及最终的检测性能。因此，在设计目标检测网络时，精心选择和设计激活函数是一个重要环节。

2024-05-24 21:16:50 4819

原创【YOLOv5/v7改进系列】替换特征融合网络为AFPN

介绍了一种新的特征金字塔网络结构——渐近特征金字塔网络（Asymptotic Feature Pyramid Network, AFPN），旨在解决目标检测任务中多尺度特征提取的问题，特别是非相邻层级间特征信息的损失和退化。

2024-05-22 19:34:26 2008 8

原创【YOLOv5/v7改进系列】替换上采样层为转置卷积

转置卷积，又称为分数步长卷积或错位卷积，常用于上采样操作。

2024-05-17 19:23:21 1455

原创【YOLOv5/v7改进系列】替换上采样层为双三次插值方式

原始的YOLOv5/v7等目标检测算法在上采样层常常使用最近邻插值，在实际实验过程中，我们还可以采用更多的插值方式等来替换。

2024-05-16 13:56:18 1181

原创【YOLOv5/v7改进系列】替换上采样层为双线性插值方式

原始的YOLOv5/v7等目标检测算法在上采样层常常使用最近邻插值，在实际实验过程中，我们还可以采用更多的插值方式等来替换。

2024-05-16 11:49:19 626

原创【YOLOv5/v7改进系列】替换上采样层为CARAFE

CARAFE以其独特的设计，实现了既高效又有效的特征上采样，为深度学习领域的密集预测任务提供了强大的工具，并展现出在低级视觉任务如图像复原和超分辨率中的应用潜力。

2024-05-15 15:30:05 953 2

原创【YOLOv5/v7改进系列】引入YOLOv8的C2f模块

【YOLOv5/v7改进系列】引入YOLOv8的C2f模块

2024-05-15 10:38:37 2250 7

原创【YOLOv7改进系列】引入YOLOv5的C3模块

C3模块的第二阶段使用深度可分离的膨胀卷积，扩大了感受野，增强了全局一致性。：C3模块采用两阶段设计，首先使用深度方向的非对称卷积来收集并压缩相邻像素的信息，减轻由于膨胀卷积造成的局部信息丢失问题。总之，C3模块通过创新的结构设计，有效融合了深度可分离卷积和膨胀卷积的优点，实现了轻量化模型设计中的一个关键突破，同时保持了分割和分类任务的高性能表现。：除了语义分割，C3模块还被应用于ImageNet分类任务，展示出替换膨胀卷积并维持或提升性能的能力，进一步验证了其作为深度学习基本构建块的潜力。

2024-05-14 21:31:59 789

原创【YOLOv5/v7改进系列】替换骨干网络为ShuffleNetv2

替换YOLOv5s/n、v7-tiny骨干网络为ShuffleNetv2.《ShuffleNet V2: Practical Guidelines for Efficient CNN Architecture Design》提出了一种新的卷积神经网络（CNN）架构设计方法，并给出了一系列实用的设计指南，旨在提高模型在实际应用中的效率。

2024-05-14 08:00:00 1273 1

适用于目标检测的火星/月球陨石坑探测的YOLO格式的数据集

数据集主要包含： 1.图像数据：可能包含陨石坑的火星和月球表面图像。数据源混杂。对于火星图像，图像主要来自 ASU 和 USGS；目前所有月球图像都来自美国宇航局月球勘测轨道器任务。所有图像均使用 RoboFlow 进行预处理，以去除 EXIF 旋转并将大小调整为 640*640。 2.标签：每个图像都有其关联的 YOLOv5 文本格式的标签文件。标注工作由我们自己完成，主要用于物体检测。 3.与琐碎的对象检测任务相比，该数据集有些挑战性： 1）陨石坑的大小差异很大 2）该数据集结合了火星和月球表面图像，其中陨石坑的形状/颜色等可能不同。 3）目前只有143张图像可用于训练（如果执行训练-测试-有效分割）。但是，作者说将来会添加更多图像。在提供者作者的 YOLOv5m6模型检测获得了 0.6919 的 mAP_0.5 分数。来自https://www.kaggle.com/datasets/lincolnzh/martianlunar-crater-detection-dataset 在你按照我的博客教程配置好你的目标检测代码后，可用这个数据集进行一个有趣的尝试体验。

2024-07-01

YOLOv7输出的txt结果转为xlsx形式

对于小白而言，进行YOLO系列的训练时能发现，不做修改的YOLOv5项目直接运行输出的结果文件中包括results.csv，而不做修改的YOLOv7项目直接运行输出的结果文件中只包括results.txt。因此，若不修改项目整体代码，对输出的txt文件进行数据观察是十分费时费力的。因此十分有必要将其转换为excel文件。因此，该文件的作用是将输出格式进行转换。使用时可以发现，在你训练后生成的exp文件夹中有许多文件，进行数据结果的存储整理时，有的是有必要保留的，有的是没必要存在的，建议对每轮训练后的文件做处理。然后将results.txt存放到一个新的文件夹下和本文件存放在一起，直接运行即可生成该results.txt对应的results.xlsx。本文件是.py形式的，也就是你需要先下载python（python很容易，这对大部分小白是很友好的），编译器类型不强制。使用前需要有安装pandas库。

2024-06-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人