【RT-DETR有效改进】轻量级视觉变换器RepViT改进特征提取网络（轻量化网络）

原创已于 2024-01-29 15:32:51 修改 · 3.5k 阅读

·

29

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#人工智能 #YOLO #目标检测 #深度学习 #计算机视觉 #python #RT-DETR

于 2024-01-17 03:36:56 首次发布

RT-DETR有效改进专栏专栏收录该内容

68 篇文章 ¥129.90 ¥299.90

订阅专栏

本文介绍了如何将RepViT，一种轻量级的视觉变换器，应用于RT-DETR的目标检测任务中，以提高模型性能。通过结构重组、扩展比率调整等优化，实现参数量减少且精度提升。详细教程涵盖了RepViT的基本原理、核心代码以及在RT-DETR中的具体修改步骤，包括对网络结构、计算量打印问题的解决等关键修改。

👑欢迎大家订阅本专栏，一起学习RT-DETR👑

一、本文介绍

本位给大家带来的改进机制是RepViT。它是一种最新发布的网络结构，把轻量级的视觉变换器（就是ViT）的设计理念融入到了我们常用的轻量级卷积神经网络（CNN）里。我尝试把它用在RT-DETR的主干网络上，效果还不错，mAP有一定的提高。我用的是这个网络中最轻量级的版本。我将其用于在我的数据上实验（包含多个类别其中包含大中小多个目标类别），无论哪种目标，精度均有所提升。接下来，我会展示一下原始版本和我改进后版本在训练上的对比图。之后会在文章中介绍该网络结构，然后教大家如何修改该网络结构,同时修改该主干参数量下降四分之一相对于ResNet18。

专栏链接：RT-DETR剑指论文专栏，持续复现各种顶会内容——论文收割机RT-DETR

目录

一、本文介绍

二、RepViT基本原理

三、RepViT的核心代码

四、手把手教你添加RepViT网络结构

4.1 修改一

4.2 修改二

4.3 修改三

4.4 修改四

4.5 修改五

4.6 修改六

4.7 修改七

4.8 修改八

4.9 必备修改！

4.10 RT-DETR不能打印计算量问题的解决

4.11 可选修改

五、RepViT的yaml文件

5.1 yaml文件

5.2 运行文件

5.3 成功训练截图

六、全文总结

二、RepViT基本原理

官方论文地址： 官方论文地址点击即可跳转

官方代码地址： 官方代码地址点击即可跳转

RepViT: Revisiting Mobile CNN F

了解本专栏

评论 6

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Snu77 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。