yolov5解读，训练，复现

不开心也没事

已于 2023-03-28 10:02:20 修改

阅读量2.2k

点赞数 5

文章标签：深度学习计算机视觉人工智能目标检测

于 2023-03-28 09:52:15 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_51261985/article/details/129781854

版权

本文是一位新手跟随B站UP主学习YOLV5目标检测框架的过程记录，包括从GitHub获取代码、理解数据增强方法如rectangular，环境配置，使用预训练模型进行预测，以及训练模型时遇到的问题和解决办法。文章还涉及如何制作和训练自己的数据集，使用在线标注工具进行数据标注，并提供了数据集的组织方式和配置文件的创建。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

小白的第一篇csdn...最近在准备小论文，大概率是目标检测方向了，没经验，慢慢学，本文只是跟着b站的天才up主一起训练和复现，这里只是我记录yolov5的学习历程，都是大白话，没有专业术语，肯定也会说错很多东西，但是我都想记录在这里，这样就不会忘记啦，如果有幸被人刷到我的博客，也请多多指点，多多交流！

one step: 先去github上把官方的yolov5的代码都拉下来了链接如下：GitHub - ultralytics/yolov5: YOLOv5 🚀 in PyTorch > ONNX > CoreML > TFLite

一、几种数据增强的方法

正文之前：提一下rectangular

up主解释了一下，这是yolov5中为了加快模型训练而采取的一种策略

在原来的训练数据过程中，由于每张图片宽和高不相同，而我们会将每张图片shape到一个固定的大小，这样一来，不同尺寸的图片就可以丢到同一个batch中进行训练了。但是有些图片进行resize后会出现黑边，这种黑边会影响我们训练和预测的速度。

基于原来的现象，在yolov5中进行了改进，也就是说在同一个batch里面尽可能的保证每张图片保留自己的shape（宽高），满足这个batch中的所有图片都会有较小的黑边，如最后一张狗狗图，它在某一个batch中最后的shape是520*640，这样一来，它能减少的计算量是非常可观的。

这里不得不说，up主真的很良心，把所有的数据增强的实例都放在这个这个jupyter上面，大家可以去这个github上自行搜索一下：yolov5_in_tf2_keras/data at master · yyccR/yolov5_in_tf2_keras · GitHub

配合up主的讲解食用效果更佳~：2. 数据增强细节_哔哩哔哩_bilibili

ok 写到这里，我突然发现这个up主讲的我有些听不懂了，于是我又去寻觅一个讲的更接地气一点的up主：我是土堆突然发现从一开始他就真的讲的好细致，推荐推荐推荐!!!! 不过上述讲解数据增强的部分还是很值得一听的，多学点东西肯定没坏处。

为什么我说土堆细呢，是因为一开始他就解决了困扰我很久的问题，也就是我们经常在视频中看到的从g

最低0.47元/天解锁文章

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。