YOLOv11改进 | 主干/Backbone篇 | RepViT从视觉变换器（ViT）的视角重新审视CNN的目标检测网络（适配yolov11全系列）

Snu77

已于 2024-11-01 16:36:05 修改

阅读量2k

点赞数 31

分类专栏： YOLOv11有效涨点专栏文章标签： YOLO 目标检测深度学习计算机视觉人工智能 python YOLOv11

于 2024-11-01 16:35:49 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/java1314777/article/details/143419449

版权

YOLOv11有效涨点专栏专栏收录该内容

该专栏为热销专栏榜第1名

160 篇文章 ¥179.90 ¥299.90

订阅专栏

一、本文介绍

本文给大家来的改进机制是RepViT，用其替换我们整个主干网络，其是今年最新推出的主干网络，其主要思想是将轻量级视觉变换器（ViT）的设计原则应用于传统的轻量级卷积神经网络(CNN)。我将其替换整个YOLOv11的Backbone，实现了大幅度涨点。我对修改后的网络(我用的最轻量的版本)，在一个包含1000张图片包含大中小的检测目标的数据集上(共有20+类别)，进行训练测试，发现所有的目标上均有一定程度的涨点效果，下面我会附上基础版本和修改版本的训练对比图。

（本文内容可根据yolov11的N、S、M、L、X进行二次缩放，轻量化更上一层）。

专栏回顾：YOLOv11改进系列专栏——本专栏持续复习各种顶会内容——科研必备

目录

一、本文介绍

二、RepViT基本原理

三、RepViT的核心代码

四、手把手教你添加RepViT网络结构

4.1 修改一

4.2 修改二

4.3 修改三

4.4 修改四

4.5 修改五

4.6 修改六

4.7 修改七

4.8 修改八

注意！！！额外的修改！

打印计算量问题解决方案

注意事项！！！

五、RepViT的yaml文件

5.1 RepViT的yaml文件版本1

5.2 训练文件

了解本专栏

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Snu77 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。