计算机视觉_普通网友的博客-优快云博客

计算机视觉

更新中

计算机视觉

文章数：90 文章阅读量：89409 文章收藏量：145

作者: 普通网友

这个作者很懒，什么都没留下…

展开

专栏收录文章

改进YOLOv8 | 用新CNN模块SPD-Conv处理低分辨率图像和小物体

SPD-Conv的设计灵感来源于自然界中的光圈现象，即朝向同一个方向的光被聚焦在一起形成更强的光束。SPD-Conv 模块在卷积神经网络中的作用是将传入的特征图拆分成多个频段，每个频段使用不同的卷积核进行卷积，并将结果按照其所属的频段进行加权求和。为了解决这个问题，研究人员提出了一种新的 CNN 模块： SPD-Conv，并将其应用于目标检测算法 YOLOv8 中。本文介绍了一种用于处理低分辨率图像和小物体的新 CNN 模块：SPD-Conv，并将其应用于目标检测算法 YOLOv8 中。

原创 2023-06-04 02:38:03 · 2219 阅读 · 0 评论
使用BiFPN优化YOLOv7目标检测算法

它将FPN（Feature Pyramid Network）和BiFPN相结合，在保留高分辨率信息的同时，充分利用深层次的语义信息，从而提升模型的检测效果。目标检测算法是计算机视觉领域最核心的研究方向之一。在YOLOv7中，Neck是关键模块之一，决定了模型的性能表现。为了优化YOLOv7的性能，我们尝试使用BiFPN替换掉原来的Neck模块。以上就是我们基于BiFPN优化YOLOv7目标检测算法的相关代码。您可以通过在训练数据上进行测试，来验证我们所提出的模型的性能和效果。

原创 2023-06-03 07:04:19 · 1548 阅读 · 0 评论
改进版YOLOv5/v7/v8：InceptionNeXt——当Inception遇到ConvNeXt

通过将Inception和ConvNeXt融合，使得改进版具有更加强大的检测能力，特别是对于小目标的检测效果更佳。这个模块是由Inception和ConvNeXt两个模型组合而成，旨在充分利用Inception的多通道卷积和ConvNeXt的多径卷积，提高模型的检测准确率。总的来说，通过采用InceptionNeXt模块，改进版YOLOv5/v7/v8具有更加强大的检测能力，对于小目标的检测效果更佳。实际应用中，可以根据具体需求选择相应的模型，并通过训练和推理流程得到优秀的检测结果。

原创 2023-05-29 19:30:10 · 908 阅读 · 0 评论
手把手教你训练YOLOv5模型

其中，“–img-size”指定输入图像的大小，“–batch-size”指定每个批次中的图像数量，“–epochs”指定训练的轮数，“–data”指定数据集的路径，“–cfg”指定配置文件的路径，“–weights”指定初始权重文件路径。要训练自己的YOLOv5模型，需要进行调参，下面将手把手为大家介绍如何进行YOLOv5模型的训练。其中，“–source”指定要预测的图像或文件夹，“–weights”指定最佳权重文件，“–conf”值设置置信度的阈值，“–img-size”指定输入图像的大小。

原创 2023-06-03 00:18:50 · 1360 阅读 · 0 评论
改进YOLOv7-Tiny系列：BiFPN特征融合网络实现目标检测

其中，p4_bu表示来自p3_td通道中提取的特征向量，p5_bu表示来自p4_bu通道中提取的特征向量，p6_bu表示来自p5_bu通道中提取的特征向量，p7_bu表示来自p6_bu通道中提取的特征向量。同样地，我们利用这些特征向量通过不同的比例缩放与相应的特征向量进行相加，构建特征金字塔向上的路径。其中，p6_td表示从C6通道中提取的特征向量，p5_td表示从C5中提取的特征向量，p4_td表示从C4中提取的特征向量，p3_td表示从C3中提取的特征向量。

原创 2023-05-26 21:24:31 · 2520 阅读 · 0 评论
计算机视觉中的“x模型全系列大解析（Neck篇）”，探讨图像处理技术

其中，每个卷积层都有一个1x1的卷积核，stride为1，padding为0。其中一种常见的架构是x模型，该模型由许多组卷积层和池化层组成，并以一个全局平均池化层结束。接下来，在forward方法中，我们定义了每个卷积层的前向传播步骤，并添加ReLU激活函数进行非线性处理。最后，我们将三个卷积层的输出加起来，并使用一个BatchNorm层进行归一化。通过本文，我们详细介绍了计算机视觉中的x模型和它的一个重要组成部分Neck。Neck是x模型中的一个重要区域，它包含了一些关键的卷积层，起到特征提取的作用。

原创 2023-06-03 06:56:03 · 279 阅读 · 0 评论
优化YOLOv5模型的Neck之BiFPN计算机视觉

而在YOLOv5模型的构建过程中，Neck是非常重要的一个环节，它可以将从Backbone中提取的特征图进行归一化、融合、筛选等处理，从而使模型更加稳定和准确。而在Neck中，BiFPN（Bilateral Feature Pyramid Network）是一种比较新颖和有效的设计方案，能够有效地保留特征信息的同时，减少网络参数和运算量，提高模型的效率和性能。其中，YOLOv5是一种非常优秀的目标检测算法，其结合了神经网络和计算机视觉的相关技术，可实现对各种目标的智能识别和追踪，并具有较高的准确度和速度。

原创 2023-06-01 19:09:30 · 975 阅读 · 0 评论
手把手教你实现YOLOv5目标检测（v5.0-v7.0）的GPU加速推理

YOLOv5作为目前最先进的目标检测算法之一，在各个领域都有着广泛的应用，然而对于初学者来说，调试YOLOv5模型并不是一件容易的事情。本文将手把手地教您如何进行YOLOv5模型的GPU加速推理，以及如何调整模型参数以达到更好的检测效果。最后，我们可以调整模型参数以达到更好的检测效果。本文提供了使用PyTorch框架进行YOLOv5GPU加速推理的代码，并介绍了如何调整模型参数以达到更好的检测效果。首先，我们需要安装YOLOv5模型所需的依赖库，包括PyTorch、OpenCV等。

原创 2023-06-04 02:29:46 · 1453 阅读 · 0 评论
使用ShuffleNetv2作为主干网络的YOLOv5/v7目标检测算法实现

近期，YOLOv5/v7成为了目标检测领域的热门算法，有很高的检测准确率和速度，但是其默认的主干网络Darknet53较为复杂，导致模型体积过大、运算速度变慢，因此我们需要考虑更轻量级的网络结构。本文介绍了如何将ShuffleNetv2作为YOLOv5/v7目标检测算法的主干网络，实现了轻量级的检测模型，并针对一些细节进行了优化。修改后的代码中，我们使用了ShuffleNetV2作为YOLOv5/v7的主干网络，同时也针对一些细节进行了优化，如使用了深度可分离卷积、轻量级网络结构等。

原创 2023-05-28 00:20:38 · 748 阅读 · 0 评论
改进YOLOv7系列：YOLOv7与Swin Transformer V2的结合

针对这一问题，我们将YOLOv7与Swin Transformer V2相结合，进一步提升了目标检测算法的性能。Swin Transformer V2是一种基于Transformer的新型模型结构，它突破了传统CNN的性能瓶颈，具有更好的扩展性和可解释性。但是，随着数据规模和模型规模的不断增大，传统目标检测算法在性能上也面临着一定的挑战。我们通过在YOLOv7的backbone网络中集成Swin Transformer V2模块，形成了新的检测算法模型。

原创 2023-05-29 19:57:54 · 1479 阅读 · 0 评论
YOLOv7改进方式提升，网络配置层数从104层压缩到24层

YOLOv7是目标检测中一种高效的神经网络模型，但是原始的网络结构使用了104层的卷积神经网络。为了更清晰、更方便、更快速地对YOLOv7进行改进，我们采用了一种改进方式，并将网络配置层数从104层压缩到24层。可以看到，我们将YOLOv7的网络结构从104层压缩到了24层，并且加入了通道平衡和跳跃连接等改进策略。我们通过一定的规则来约束网络中每个卷积层的通道数，从而保证网络各层之间的通道数平衡。我们在网络中加入了多个跳跃连接，从低层到高层逐渐增加，以实现不同层之间的信息交流和特征融合。

原创 2023-05-26 21:25:13 · 1140 阅读 · 0 评论
YOLOv7改进之实验结果：新增mAP75值的打印及其意义

在许多数据集上，mAP75被认为是一个重要的指标，它强调了更高的检测精度和更少的误检概率。这样做的好处在于，我们可以更加全面、准确地评价模型的性能，找到模型中存在的问题，并进行优化。通过以上代码，我们可以得到在IoU为0.75时的模型检测精度（mAP75），并可以根据这个值来评估模型的性能。如果mAP75较低，我们可以分析数据集或模型架构中的问题，并进行针对性的改进。总结起来，YOLOv7新增的针对mAP75值的计算和打印，能够帮助我们更全面、准确地评价模型的性能，在计算机视觉领域中具有非常重要的意义。

原创 2023-05-28 00:06:49 · 1124 阅读 · 0 评论
YOLOv7_轻量高效MobileOne结构与苹果Backbone主干网络模型

该模型借鉴了苹果公司在iOS设备上的神经网络加速器Neural Engine的设计思路，采用了三个不同的卷积操作：标准卷积、深度可分离卷积和逐通道卷积，通过并行和串联等方式构建出高效的网络架构。近期，研究人员针对其性能和效率做了一些改进，推出了新的版本——YOLOv7_轻量高效MobileOne结构与苹果Backbone主干网络模型。该结构利用MobileNetV3中的深度可分离卷积，将原本的3x3卷积核拆分为1x3和3x1两个卷积操作，降低了参数和计算量，同时保持了较好的准确率。

原创 2023-06-01 20:06:20 · 758 阅读 · 0 评论
改进YOLOv7系列：融合自注意力和卷积的ACmix结构，提高性能

本文将介绍一种新的改进算法：融合自注意力和卷积的ACmix结构，该结构在保证性能的同时大幅度降低了计算复杂度。在YOLOv7算法中加入ACmix结构，可以得到更高的检测精度和更快的计算速度。如果读者有兴趣，可以尝试将ACmix结构应用在其他深度学习算法中，以期取得更好的效果。ACmix结构的作用是加强特征，融合了自注意力和通道注意力，使检测结果更加准确。同时，该结构减少了卷积层数量，降低计算复杂度，提高了运算效率。ACmix结构采用了自注意力和卷积的融合，将二者相互补充，以达到更好的性能表现。

原创 2023-05-31 19:34:35 · 594 阅读 · 0 评论
小目标检测的新突破——归一化高斯Wasserstein Distance Loss

在目标检测领域，YOLOv7无疑是一个备受称赞的算法，它具有高速和高精度的优点，但是对于小目标检测，它在检测精度方面仍有改进空间。在这篇文章中，我们提出了一种新的包围框相似度度量方法，即归一化高斯Wasserstein Distance Loss (N-GWDLoss)。N-GWDLoss是针对小目标检测而设计的，它通过归一化高斯形式的Wasserstein距离来度量包围框之间的相似度。与传统的L1、L2和IoU度量不同，N-GWDLoss能够有效地缩小目标检测中小目标检测与大目标检测之间的性能差距。

原创 2023-05-29 20:04:48 · 1470 阅读 · 0 评论
改进YOLOv5 | 增加注意力机制优化C3模块性能

因此，我们在C3模块中添加了四种不同的注意力机制，以进一步优化模型性能。具体来说，我们添加了ParNet注意力机制、GAM注意力机制、ParallelPolarized注意力机制和Sequential注意力机制。目前，计算机视觉领域是一个非常热门的研究方向，而YOLOv5作为一款效果优异的目标检测框架在近年来也备受青睐。然而，虽然YOLOv5已经取得了很好的效果，但是其仍然存在一些可以优化的地方。可以看出，添加不同的注意力机制可以进一步提高YOLOv5模型效果。

原创 2023-06-02 21:07:48 · 1325 阅读 · 0 评论
改进YOLOv8 | 更换主干网络 | 基于PP-LCNet的轻量级目标检测算法

首先，让我们来看一下PP-LCNet的架构。接下来，我们将PP-LCNet应用于YOLOv8的主干网络中。具体而言，我们将YOLOv8原来的Darknet53网络替换为PP-LCNet，并在训练过程中使用交叉熵作为损失函数。因此，我们将其应用于改进目标检测算法YOLOv8的主干网络，以提高YOLOv8在低算力设备上的性能。经过实验比较，我们发现将原来的Darknet53网络替换为PP-LCNet后，YOLOv8在mAP指标上得到了1-2个百分点的提升，并且模型的参数量减少了约50%。

原创 2023-06-03 07:29:09 · 2893 阅读 · 0 评论
改进YOLOv8 | 引入RepVGG重参数化模块 | 计算机视觉

其中，YOLO系列目标检测算法因其高效快速而备受青睐，而最新的YOLOv8算法更加的准确和高效。本文介绍了如何通过引入RepVGG重参数化模块来改进YOLOv8算法，提高检测精度。RepVGG是一种新型的卷积神经网络结构，它采用重参数化方法将传统的卷积层替换成多个小规模的卷积子模块，并通过一定的训练策略进行优化。相比传统的卷积神经网络结构，RepVGG具有更高的计算效率和更好的模型性能。通过上述步骤，我们成功地将RepVGG重参数化模块引入YOLOv8算法中，提高了目标检测精度。

原创 2023-05-29 20:18:40 · 833 阅读 · 0 评论
改进YOLOv5系列：融合ACmix结构的自注意力和卷积优化

在前向传递过程中，我们通过获取卷积层的输出，计算出其平均值和最大值，并使用全连接层来生成权重矩阵。然而，针对它的一些缺点，我们提出了一种改进的方法：将自注意力和卷积集成并融合ACmix结构。ACmix结构可以通过使用适当的卷积操作，来更好地捕捉图像中不同尺度的特征，并使得特征检索更具有可预测性。自注意力是一种能够理解序列间依赖关系的机制，而卷积可以通过不同大小的卷积核来感知图像特征，并帮助我们提取更有意义的信息。在实际操作中，我们可以通过以上所述的代码来实现该模型，并在目标检测中取得更好的性能表现。

原创 2023-06-02 21:23:38 · 739 阅读 · 0 评论
“轻松搭建计算机视觉神器！YOLOAir库多种内置网络模型配置详解“

其中 `--checkpoint_file` 参数用于指定模型权重文件路径，`--eval_type` 参数用于指定评估类型。## 总结通过使用 YOLOAir 库，我们可以轻松地搭建计算机视觉应用，实现目标检测、物体识别等功能。同时，也可以使用 YOLOAir 训练自己的模型，在特定的领域取得更好的效果。

原创 2023-05-27 01:06:27 · 314 阅读 · 0 评论
计算机视觉中的颈部检测：从X模型到NeckNet

NeckNet是一种基于Transformer的颈部检测模型，它利用了Transformer的自注意力机制来捕捉图像中的全局信息。具体的，NeckNet首先将输入图像划分成多个块，在每个块上运行一个Transformer模型，再通过多层卷积、池化和全连接层对特征进行后处理。计算机视觉中的颈部检测一直是重要的一环。本文将介绍两个颈部检测的模型：X模型和NeckNet，并提供相应的源代码。X模型是基于卷积神经网络的颈部检测模型，其核心思想是通过多个卷积层和池化层来提取特征，最终输出颈部的位置信息。

原创 2023-06-04 01:48:20 · 177 阅读 · 0 评论
「提升FPS——计算机视觉图像处理优化」——代码实现

本文介绍了一些针对图像处理的优化方法，包括图像缩放、图像裁剪、图像旋转、图像锐化和光照调整等，并给出了相应的代码实现。其中，img为原始图片，width和height分别表示缩放后的宽度和高度，inter表示缩放方式。采用该方法可以根据需求，将输入图片调整为特定尺寸，从而加快图像处理的速度。其中，img为原始图片，(x,y)表示裁剪位置，w和h表示裁剪后的宽度和高度。在图像处理中，光照不足或过度的情况会影响图像处理的效果，因此需要对输入图像进行光照调整。其中，img为原始图片，beta表示亮度调整值。

原创 2023-06-05 04:32:33 · 283 阅读 · 0 评论
Swin-Transformer小目标检测头在YOLOv5上的优化

Swin-Transformer是一种新型的Transformer模型，相比于传统的Transformer模型，它采用了分层的方式来处理图像信息，从而减少了模型的计算量，同时提高了模型的精度。在本文中，我们将使用Swin-Transformer来设计小目标检测头，以提高YOLOv5在小目标检测方面的能力。通过以上步骤，我们成功实现了基于Swin-Transformer的小目标检测头，并将其应用到了YOLOv5模型中，该模型能够更好地处理小目标检测任务。

原创 2023-05-28 00:34:29 · 1195 阅读 · 0 评论
重新定义实时目标检测：YOLOv8的原理解析

DPM并不像传统的卷积层那样对输入特征图进行降维处理，而是直接基于高维特征图进行密集的预测，从而保留了更多的细节信息。此外，YOLOv8还采用了一种名为Soft-Gated Skip Connection (SGSC) 的技术，利用门控神经元来动态调整不同特征图之间的相互关系，从而更好地捕捉目标物体在不同尺度下的特征。以上代码实现了一个基本的YOLOv8网络结构，其中包含了一个基础的卷积层、若干个BasicBlock模块、若干个SGSC模块、一个DPM模块，可以根据实际需求进行更改和扩展。

原创 2023-06-01 19:17:51 · 1874 阅读 · 0 评论
YOLOv7网络模型改进：网络配置文件更简洁实用！

相比于YOLOv5，YOLOv7在保持准确率不变的情况下，使用更少的层数达到了更快的速度，同时还有更小的模型大小。本文将介绍YOLOv7的改进之处，以及如何使用网络配置文件快速修改模型。我们将每个卷积层、批量归一化层、ReLU激活函数以及全连接层的信息存储在配置文件中，然后在函数中解析配置文件，构建相应的层次，并将其设置为模型的属性。我们将网络配置文件存储为JSON格式，并读取配置文件中的信息以构建模型。以上是我们的改进，我们相信您可以使用这个网络配置文件快速修改YOLOv7网络模型。

原创 2023-05-31 19:47:01 · 653 阅读 · 0 评论
改进YOLOv5系列：新增多种ConvNeXt结合YOLO | 多样化的主干CNN模型选择 | 计算机视觉

ConvNeXt是一种新型的卷积神经网络结构，利用组卷积和通道并行的方式使得网络更加有效率和灵活性。我们将ConvNeXt与YOLOv5结合，可以获得更好的检测效果，并且还可以根据需求进行不同的主干CNN模型选择。我们可以通过简单修改函数参数，即可选择不同的主干CNN模型。这样，我们就可以在不同的场景中使用不同的模型，并且还可以通过ConvNeXt结合YOLOv5来提升检测效果。YOLOv5是一种基于深度学习的目标检测算法，具有高效和准确的特点。我们还可以根据具体任务需求，选择不同的主干CNN模型。

原创 2023-05-28 01:10:21 · 536 阅读 · 0 评论
“自定义数据集的目标检测精度评估方法——针对大中小目标的mAP值计算“

本文介绍了一种针对大中小目标的mAP值计算方法，可以应用于自定义数据集的目标检测任务中。通过该方法，可以很好地评估模型在各个类别上的性能表现，并且能够提供丰富的实验数据，便于进行对比分析。

原创 2023-06-05 04:55:53 · 788 阅读 · 0 评论
使用GAMAttention优化YOLOv8模型计算机视觉

其中ConvBlock表示卷积块，ResidualBlock表示残差块，AttentionBlock表示注意力块，YOLOv8是整个模型的实现。在YOLOv8中，我们使用了多个ResidualBlock进行特征提取，同时也添加了AttentionBlock注意力模块，帮助模型更关注重要的部分。其中GAMAttention是一种比较有效的注意力机制，它能够帮助模型更关注重要的部分，从而提升准确度。通过以上步骤，我们成功地添加了GAMAttention机制来优化YOLOv8模型，从而提高其检测准确度。

原创 2023-05-31 20:09:17 · 375 阅读 · 0 评论
改进YOLOv8 | 添加注意力机制 | 适用于多种任务

通道注意力模块使用平均池化和最大池化来获取通道的平均值和最大值，并将它们馈入两个全连接层。本文将介绍如何通过添加注意力机制来提升YOLOv8的性能，使其适用于更多的计算机视觉任务。注意力机制是一种常见的神经网络算法，它可以帮助我们在输入数据中寻找特别重要的部分。在目标检测任务中，我们可以使用注意力机制来提高算法对于重要目标的识别精度。在这里，我们继承了YOLOv8，并将CBAM应用于所有卷积层。这样，我们就可以通过使用注意力机制来改进YOLOv8，使其适用于多种计算机视觉任务。

原创 2023-06-02 22:14:56 · 1267 阅读 · 0 评论
改良YOLO系列：引入SIoU / EIoU / WIoU / Focal_xIoU学习策略

该算法首先对两个边界框之间的交集进行加权处理，以减轻小目标的影响，然后计算加权交集和加权并集之间的比率。与传统的IOU值不同，EIoU考虑了边界框的不对称性，以实现更好的检测效果。它将两个边界框之间的IOU值转化为一组加权的概率分布，以更好地捕捉较小目标的特征。为了解决这一问题，近年来发展了一种基于深度学习的目标检测算法，即YOLO（You Only Look Once），其设计简单、实时性好、准确率高，已经成为目前领域内最为流行的解决方案。特别是对于较小的目标，传统的检测方法通常会存在精度不足的问题。

原创 2023-05-29 19:38:25 · 1371 阅读 · 0 评论
YOLOv8系列：引入SEAttention注意力机制提升目标检测精度

SEAttention机制的基本思想是对卷积特征图中的通道进行自适应加权，以突出重要的特征。在目标检测领域，常用的算法之一是YOLO（You Only Look Once），其中最新的版本为YOLOv8。应用于YOLOv8的编码器部分，以增强特征图中的重要特征。在本文中，我们介绍了如何通过引入SEAttention注意力机制来改善YOLOv8的目标检测精度。为了在YOLOv8中实现SEAttention，我们需要在网络的底部添加一个注意力模块，并在每个卷积层中使用它。在代码中，我们定义了一个名为。

原创 2023-05-29 19:24:35 · 2760 阅读 · 0 评论
“加强YOLOv8：S2-MLPv2注意力机制在计算机视觉中的应用“

该模块可以接收一个大小为（bs，in_channels，h，w）的张量，并在特征图的通道维上进行自适应平均池化运算。随后，通过经过两个全连接层和激活函数的运算，得到了一个与输入张量相同大小的注意力值张量。因此，近期研究者提出了一种改进版的YOLOv8，即添加了S2-MLPv2注意力机制。在这里，我们添加了一个名为attn的参数，用于接收注意力模块S2MLPAttention的实例。在前向传播过程中，如果attn不为None，则将输入张量x传入到注意力模块中，然后再将得到的张量作为输出。

原创 2023-06-04 02:04:54 · 317 阅读 · 0 评论
改良YOLOv8网络架构 | 采用SwinTransformer网络 | 借助位移窗口实现视觉变换 | 计算机视觉

我们可以使用PyTorch Hub来直接下载预训练的SwinTransformer模型，然后将其作为YOLOv8的主干网络即可。随着计算机视觉技术的不断发展，研究人员们也在不断尝试对各种神经网络进行改良，以提高它们的性能和准确度。本文将介绍如何通过更换主干网络、引入SwinTransformer以及使用位移窗口实现视觉变换的方式，来进一步提高YOLOv8的性能。接下来，我们引入一种称为“位移窗口”的操作，通过在特征图上进行像素级别的平移，来实现视觉变换。

原创 2023-05-30 19:51:39 · 1664 阅读 · 0 评论
基于YOLOv7的头部解耦改进 | 利用YOLOX解耦头优化YOLOv7 | 提高计算机视觉识别率

然而，这些任务间并不是完全独立的，因此，我们需要将它们解耦，以提高算法的准确度。为了解决这个问题，我们采用 YOLOX 中的头部解耦方法，将头部分成两个独立的分支，一个用于分类任务，一个用于目标检测任务。通过头部解耦方法，我们可以从 YOLOv7 中分离出分类和目标检测的任务，将它们分别交给不同的头部进行处理，最终提高算法的准确度。这个新的头部由两个分支构成，一个负责目标检测和回归，另一个负责分类。方法中，我们将输入图像数据传入主干模型中，然后将特征图分别传递到目标检测头和分类头中。

原创 2023-05-30 19:37:22 · 1414 阅读 · 0 评论
FPS比较图表（YOLOv6/YOLOv7）- 计算机视觉

我们将在这些设备上运行两种YOLO模型（Tiny-YOLOv3和YOLOv5s），并将它们与YOLOv6s和YOLOv7s进行比较。本篇文章将展示YOLOv6和YOLOv7在不同硬件设备上的FPS比较图表，并提供相应的源代码。在实际应用中，我们可以根据硬件设备的性能选择不同的YOLO模型。如果设备性能较高，则可以使用YOLOv6s或YOLOv7s来获得更快的检测速度。从结果可以看出，YOLOv6s是最快的模型，而Raspberry Pi 4上的FPS最低。

原创 2023-05-31 20:21:43 · 912 阅读 · 0 评论
深度学习中模型调参一直是非常重要的环节，良好的调参能够让我们取得更好的训练效果

可以在数据集下载页面(http://host.robots.ox.ac.uk/pascal/VOC/voc2012/)上下载相应的数据集并解压到指定目录下。这里需要注意的是，为了取得更好的训练效果，可使用预训练模型及使用数据增强技术。深度学习中模型调参一直是非常重要的环节，良好的调参能够让我们取得更好的训练效果。本文将介绍最新的基于 YOLOv7 模型的训练部分的手把手调参方法，并提供相应的代码。–epoch 指定训练的轮数。在完成数据集的准备和模型的配置后，我们就可以开始训练模型了。

原创 2023-06-03 00:10:33 · 315 阅读 · 0 评论
打造高准确性的目标检测器：构建高效金字塔网络架构

在目标检测任务中，我们通常使用的是基于卷积神经网络（Convolutional Neural Network，CNN）的模型。CNN 可以有效地提取图像中的特征，但是由于 CNN 本身的结构限制，它只能在一个尺度上提取特征。例如，我们可以使用不同大小的滤波器，或在不同层次上运行 CNN，从而在多个尺度上提取特征。使用金字塔网络可以在不同的尺度上提取图像中的特征，并将这些特征集成到一个整体的特征表示中。在模型训练完成后，我们可以将其用于图像中的目标检测任务，并获得较高的精准度和效率。

原创 2023-05-30 20:04:23 · 330 阅读 · 0 评论
改进YOLOv7系列：引入SimAM注意力机制

SimAM（Simple Attention Mechanism）是一种简单的注意力机制，它可以有效提升模型性能。SimAM的设计思路源于SENet，但不同于SENet的复杂结构，SimAM只使用了一个全局池化层和几个全连接层。具体来说，我们在YOLOv7的倒数第二个卷积层后面加上一个全局池化层，将卷积层的输出向量变为标量。其中，目标检测是一个重要的应用场景。YOLOv7是一个效果很好的目标检测模型，在许多任务和数据集上的表现都很优秀。总之，在目标检测任务中，注意力机制是一种非常有效的方法。

原创 2023-06-03 00:25:39 · 3344 阅读 · 0 评论
改进YOLOv8 | 主干网络篇 | EfficientNet

在此代码示例中，我们使用了EfficientNet-b4作为YOLOv8的主干网络，将其与原有的YOLOv8模型进行结合，得到了一个新的目标检测算法。在目标检测领域中，YOLOv8是一种常用的算法，其效果优秀、速度快是众所周知的。但是，如果将YOLOv8的主干网络替换成更先进的模型，比如EfficientNet，就能进一步提升其效果和速度。综上所述，通过将EfficientNet作为YOLOv8的主干网络，可以对算法进行有效的改进，进一步提升其性能。

原创 2023-06-02 21:50:00 · 1765 阅读 · 0 评论
优化YOLOv8算法 | 全方位动态卷积应用 | 计算机视觉

该方法基于卷积神经网络（CNN）的卷积层，不同的是，我们将卷积核从二维扩展到多维，以适应不同的输入数据。同时，为了保证模型的效果，我们还引入了自适应卷积核大小和卷积核通道数的思想，使得模型可以根据输入数据的特性自动调整卷积核参数。具体实现上，我们定义了一个全维动态卷积层类，并将其作为YOLOv8算法的一部分，以此达到优化目的。为了解决这些问题，我们提出了一种改进的YOLOv8算法，利用全维动态卷积来提高图像分辨率，适应目标尺寸变化范围更大的场景，以此提高目标检测的精度和稳定性。

原创 2023-05-29 19:52:20 · 940 阅读 · 0 评论

计算机视觉

作者: 普通网友

改进YOLOv8 | 用新CNN模块SPD-Conv处理低分辨率图像和小物体

使用BiFPN优化YOLOv7目标检测算法

改进版YOLOv5/v7/v8：InceptionNeXt——当Inception遇到ConvNeXt

手把手教你训练YOLOv5模型

改进YOLOv7-Tiny系列：BiFPN特征融合网络实现目标检测

计算机视觉中的“x模型全系列大解析（Neck篇）”，探讨图像处理技术

优化YOLOv5模型的Neck之BiFPN计算机视觉

手把手教你实现YOLOv5目标检测（v5.0-v7.0）的GPU加速推理

使用ShuffleNetv2作为主干网络的YOLOv5/v7目标检测算法实现

改进YOLOv7系列：YOLOv7与Swin Transformer V2的结合

YOLOv7改进方式提升，网络配置层数从104层压缩到24层

YOLOv7改进之实验结果：新增mAP75值的打印及其意义

YOLOv7_轻量高效MobileOne结构与苹果Backbone主干网络模型

改进YOLOv7系列：融合自注意力和卷积的ACmix结构，提高性能

小目标检测的新突破——归一化高斯Wasserstein Distance Loss

改进YOLOv5 | 增加注意力机制优化C3模块性能

改进YOLOv8 | 更换主干网络 | 基于PP-LCNet的轻量级目标检测算法

改进YOLOv8 | 引入RepVGG重参数化模块 | 计算机视觉

改进YOLOv5系列：融合ACmix结构的自注意力和卷积优化

“轻松搭建计算机视觉神器！YOLOAir库多种内置网络模型配置详解“

计算机视觉中的颈部检测：从X模型到NeckNet

「提升FPS——计算机视觉图像处理优化」——代码实现

Swin-Transformer小目标检测头在YOLOv5上的优化

重新定义实时目标检测：YOLOv8的原理解析

YOLOv7网络模型改进：网络配置文件更简洁实用！

改进YOLOv5系列：新增多种ConvNeXt结合YOLO | 多样化的主干CNN模型选择 | 计算机视觉

“自定义数据集的目标检测精度评估方法——针对大中小目标的mAP值计算“

使用GAMAttention优化YOLOv8模型 计算机视觉

改进YOLOv8 | 添加注意力机制 | 适用于多种任务

改良YOLO系列：引入SIoU / EIoU / WIoU / Focal_xIoU学习策略

YOLOv8系列：引入SEAttention注意力机制提升目标检测精度

“加强YOLOv8：S2-MLPv2注意力机制在计算机视觉中的应用“

改良YOLOv8网络架构 | 采用SwinTransformer网络 | 借助位移窗口实现视觉变换 | 计算机视觉

基于YOLOv7的头部解耦改进 | 利用YOLOX解耦头优化YOLOv7 | 提高计算机视觉识别率

FPS比较图表（YOLOv6/YOLOv7）- 计算机视觉

深度学习中模型调参一直是非常重要的环节，良好的调参能够让我们取得更好的训练效果

打造高准确性的目标检测器：构建高效金字塔网络架构

改进YOLOv7系列：引入SimAM注意力机制

改进YOLOv8 | 主干网络篇 | EfficientNet

优化YOLOv8算法 | 全方位动态卷积应用 | 计算机视觉

使用GAMAttention优化YOLOv8模型计算机视觉