改进YOLO系列：使用ConvNeXt作为YOLOv5/v的新骨干网络

最新推荐文章于 2024-07-02 16:54:57 发布

ZuoProgramming

最新推荐文章于 2024-07-02 16:54:57 发布

阅读量361

点赞数

CC 4.0 BY-SA版权

文章标签： YOLO python 深度学习计算机视觉

本文链接：https://blog.youkuaiyun.com/ZuoProgramming/article/details/132993034

计算机视觉专栏收录该内容

77 篇文章 ¥59.90 ¥99.00

订阅专栏

本文介绍了将ConvNeXt网络结构应用于YOLOv5/v，以增强其物体检测能力。ConvNeXt的分组卷积特性提供高效且强大的特征表示。通过代码示例展示了如何将ConvNeXt整合到YOLOv5模型中，以期望在实际任务中实现更好的检测效果。

YOLO（You Only Look Once）是一种高效的物体检测算法，YOLOv5/v是YOLO系列的最新版本。为了进一步提高YOLOv5/v的性能，我们可以考虑将现有的骨干网络替换为ConvNeXt。

ConvNeXt是一种基于分组卷积的网络结构，它在保持计算效率的同时，具有较强的特征表示能力。通过使用ConvNeXt作为YOLOv5/v的骨干网络，我们可以期望在物体检测任务中获得更好的性能。

下面是使用ConvNeXt作为YOLOv5/v骨干网络的源代码示例：

import torch
import torch.nn as nn
import torch.nn.functional as F
from torch.hub import load_sta

了解本专栏

订阅专栏解锁全文

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

ZuoProgramming

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

订阅专栏

YOLOv5系列的改进：使用ConvNeXt结构增强YOLO的计算机视觉能力

IlgCrystal的博客

09-20

795

热门推荐

包括YOLOv5、YOLOv7、YOLOv8等模型改进

08-21

1万+

参与评论您还未登录，请先登录后发表或查看评论

ConvNeXt-Yolo5

m0_46179553的博客

01-23

5630

背景简介传说中的CV算法工程师抄作业必备手册，既然大佬们烧了那么多的电费为我们总结了这么多能work的trick,那岂有不抄的道理，具体论文的细节本文不做详述，论文地址如下： https://arxiv.org/abs/2201.03545 以及大佬对此的详细解读 https://mp.weixin.qq.com/s/c6MRbzQE9ErFUWdWKh8PQA 本文仅做对工程应用的整合。 ConvNeXt-YoloV5 仍然以目标检测经典模型yolov5为例，对源代码做如下的修改增加 common.py

YOLOv7改进：ConvNeXt（backbone改为CNeB）

weixin_45303602的博客

09-27

2163

论文地址官方源代码地址自从ViT(Vision Transformer)在CV领域大放异彩，越来越多的研究人员开始拥入Transformer的怀抱。回顾近一年，在CV领域发的文章绝大多数都是基于Transformer的，比如2021年ICCV 的best paper Swin Transformer，而卷积神经网络已经开始慢慢淡出舞台中央。卷积神经网络要被Transformer取代了吗？也许会在不久的将来。

YOLOv5改进 | 主干网络 | ODConv + ConvNeXt 增强目标特征提取能力

kay_545

07-02

2655

yolov5改进，ConvNeXt，yolov5

改进YOLO系列 | YOLOv5/v7 更换骨干网络之 ConvNeXt

YOLOv8项目贡献者

01-17

5725

YOLOv5 更换骨干网络之 ConvNeXt

YOLOV5/YOLOV7/YOLOV8改进：InceptionNeXt: 当 Inception 遇上 ConvNeXt

AIcurator的博客

04-06

1169

1.论文介绍回顾深度学习的历史，卷积神经网络 (CNN) 无疑是计算机视觉中最受欢迎的模型。2012年，AlexNet 在 ImageNet 竞赛中获胜，开启了 CNN 在深度学习特别是计算机视觉领域的新时代。从那时起，众多的 CNN 已经成为潮流的引领者，如 Network In Network，VGG，Inception Nets，ResNe(X)t，DenseNet 等。

学Java，找哪吒

05-18

4137

ConvNeXt的网络结构基于Inception-v4，但采用了更加灵活的多尺度卷积设计。具体而言，ConvNeXt将不同尺寸的卷积核组合成一个大的卷积核，从而提高感受野并减少参数数量。为了进一步降低参数数量和计算复杂度，ConvNeXt采用了分组卷积，并且在卷积层之间添加了批量归一化（Batch Normalization）和激活函数（ReLU）。

YOLOv8 中替换主干网络之 ConvNext：完整解析与实现

走向CTO的路上...

05-26

1426

ConvNext 采用 Transformer 的注意力机制，可以捕获更长距离的依赖关系，提升模型的性能。ConvNext 采用 Depthwise Convolution 和 Linear Attention 等技术，可以减少模型的参数量，使其更易于部署在资源受限的设备上。ConvNext 可以应用于图像分类、目标检测、语义分割等多种任务。由于 ConvNext 的上述优点，使其成为 YOLOv8 中替换主干网络的理想选择。

YOLOV5加入Convnext模块，助力涨点！

weixin_57058018的博客

05-09

596

修改好过后我们再进入models文件夹中的yolo.py文件，添加好改好的yaml文件，并且运行yolo.py文件，出现如下界面即表示添加成功了。我们找到models文件夹中的common.py文件，添加CNeB模块，如下。添加好过后我们再找到yolov5.yaml文件，修改里面的参数。然后我们再找到models文件夹中的yolo.py文件中的。，如下图所示添加CNeB模块。parse_model函数。

改进目标检测算法之YOLOv5：ConvNeXt骨干网络

带你成为别人眼中的大佬！

05-28

1083

然后，下载ConvNeXt的预训练模型，在这里使用的是分类模型connext_26，该模型以ImageNet数据集为训练集，包含26层。然而，YOLOv5默认使用CSPDarknet53骨干网络，在更高精度的场景下，计算代价较高。因此，本文介绍如何将YOLOv5的骨干网络替换为ConvNeXt，以实现更好的性能。接下来，我们需要修改train.py文件中的相关参数，来适配ConvNeXt网络。经过以上步骤的改动，我们就成功地将YOLOv5的骨干网络替换为ConvNeXt网络，获得了更好的性能表现。

ConvNeXt+YOLOv7改进方案

ZzzzzKnight的博客

10-25

4061

改进代码

YOLOv5：修改backbone为ConvNeXt

FriendshipTang的博客

09-14

1218

Python、PyTorch、YOLOv5、backbone、ConvNeXt

改进YOLOv7系列：结合ConvNeXt优化YOLOv7的计算机视觉模型

QvisCs的博客

09-20

507

YOLOv7是一种广泛应用于计算机视觉领域的目标检测算法。为了进一步提升YOLOv7的性能和准确率，我们将ConvNeXt结构与YOLOv7相结合，构建了CNeB模块。本文将详细介绍这一改进的方法，并提供相应的源代码。

【YOLO改进】换遍MMPretrain主干网络之ConvNeXt-Tiny（基于MMYOLO）

Vlone_pp的博客

05-19

1387

ConvNeXt-Tiny 是一种改进的卷积神经网络架构，其设计目的是在保持传统卷积神经网络优势的同时，借鉴了一些Transformer架构的成功经验。： ConvNeXt-Tiny 采用了更大范围的卷积核和较少的池化操作，这使得它在同样的计算预算下，能够捕捉到更丰富的特征信息，提高了模型的性能。其优化的卷积架构可以在保证精度的同时，提供更快的推理速度。： ConvNeXt-Tiny 的模型大小和复杂度适中，这使得它可以在保持高检测精度的同时，不会大幅增加YOLO网络的计算负担。

2.6.6 YOLOV5_ConvNeXt代码注释

weixin_71719718的博客

08-13

327

x * random_tensor：表示对不参与计算的样本（图片）的矩阵的所有值修改为0，即导数为0，对参与计算的样本（图片）的矩阵的所有值乘以2，对其方法2倍。#根据参与计算的样本的概率keep_prob，依据泊松分布随机获得参与计算和不参与计算的样本，比如样本总数n=3，参与计算的位置为0,2，不参与计算的位置为1，#则输出值为[[[1]],[[0]],[[1]]]，即对参与计算的赋值为1，不参与计算的赋值为0。#drop_prob（0，1）：在一批样本中，不参与计算的样本的概率。

pytorch修改ConvNeXt-T网络

weixin_73101319的博客

05-28

539

使用迁移学习，修改ConvNeXt-T网络，对特征进行融合。

改进YOLOv5系列：使用ConvNeXt与多种主干CNN模型实现高效目标检测

YjmnDatabase的博客

09-19

272

目标检测一直是计算机视觉领域中的重要任务之一，而YOLOv5则是近年来备受关注的一种目标检测算法。为了进一步提升YOLOv5的检测效果，许多研究人员进行了不断的探索和尝试。本文将介绍一种基于YOLOv5的改进版本，通过引入ConvNeXt模块和不同的主干CNN模型，实现了高效的目标检测。通过引入ConvNeXt模块和不同主干CNN模型，我们可以轻松实现高效的目标检测，提升YOLOv5的性能表现。接着，我们将训练集和测试集准备好，以COCO格式为例。然后，我们可以使用以下代码定义模型，其中。

【第64篇】ConvNeXt V2论文翻译：ConvNeXt V2与MAE激情碰撞

AI浩

01-06

2417

论文链接：ConvNeXt V2 在改进的架构和更好的表示学习框架的推动下，视觉识别领域在21世纪20年代初实现了快速现代化和性能提升。例如，以ConvNeXt[52]为代表的现代ConvNets在各种场景中都表现出了强大的性能。虽然这些模型最初是为使用ImageNet标签的监督学习而设计的，但它们也可能受益于自监督学习技术，如蒙面自编码器(MAE)[31]。然而，我们发现，简单地结合这两种方法会导致性能不佳。在本文中，我们提出了一个全卷积掩码自编码器框架和一个新的全局响应归一化(GRN)层，可以添加到Co

convnext v2 yolov5