yolov5训练（心得）

最新推荐文章于 2025-10-16 15:26:05 发布

原创最新推荐文章于 2025-10-16 15:26:05 发布 · 5.3k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

人工智能同时被 3 个专栏收录

15 篇文章

订阅专栏

11 篇文章

订阅专栏

人工智能框架pytorch

5 篇文章

订阅专栏

部署运行你感兴趣的模型镜像

yolov5成功训练真的是一波三折

1 coco数据的下载

（两种：128，用于小批量测试，可以用来测试程序是否正常，真正训练的时候还是需要coco数据集，自己自定义的数据可以根据coco128.yaml文件夹的形式来定义,coco.yaml是txt的方式 coco全套数据集，标签yolov5 github上有 release v1）

2 运行程序

1）window成功，虚拟机失败，服务器失败

表象：如下图所示卡在那里不对
在这里插入图片描述

排查原因：

1：发现dataloader数据不对，循环打印，打印不出来，终于找到原因

2：对比为什么windows可以，服务器不可以，发现windows安装的是torch1.6，而服务器安装的pytorch1.6，那么问题来了，安装torch1.6到服务器，事实上pytorch1.6是用conda安装的，torch1.6是用pip安装，理论上是一样的，好了，还是用pip安装吧，事实上安装了，但是效果依然卡在如上图所示；

3：痛苦，花了这么多力气还是不行，看着程序好无力，好吧，我想是不是dataLoader的参数就问题呢，那么我将num_workers屏蔽掉，乖乖嘞，居然可以跑，那么我依次将num_workers设置为1，2，3，将GPU设置多个，还是不行，因此，在此服务器上跑，只能将num_workers=0，最后终于跑起来了。

loader(dataset,
batch_size=batch_size,
num_workers=nw,
sampler=sampler,
pin_memory=True,
collate_fn=LoadImagesAndLabels.collate_fn)

4 Initializing libiomp5md.dll, but found libiomp5md.dll already initialized.

import os

os.environ[“KMP_DUPLICATE_LIB_OK”]=“TRUE”

5：很多人跑yolov5很简单，没有遇到我这样的问题，但是经历过这个问题后，对于pytorch跑模型有了一下几点心得：

1）环境是否安装正确，一般能跑，就应该是正确的；

2）硬件环境是否设置正确，包括GPU,CPU,NPU,TPU等个数，是否存在；

3）windows和linux不一样,num_worker,或者进程和线程之类（比较难排查；

4）数据的位置；

您可能感兴趣的与本文相关的镜像

Yolo-v5

Yolo-v5

Yolo

YOLO（You Only Look Once）是一种流行的物体检测和图像分割模型，由华盛顿大学的Joseph Redmon 和Ali Farhadi 开发。 YOLO 于2015 年推出，因其高速和高精度而广受欢迎

7 条评论

AIJPQ 2021.08.24
num_worker是内存不够就不能运行

weixin_45937388 2021.05.26
环境没有配置好，应该是缺包

莫斯科不眠夜 2021.01.27
想问一下博主，我直接把win下的代码移植到linux下，一直报错说找不到图，我在win上都能跑
- 仙凡兄回复莫斯科不眠夜 2021.01.27
  修改图片的路径

LLLLLuuusa 2020.12.12
好巧,我和博主一样,排查了好久才发现win10下不允许pytorch进行多线程操作,只好把dataloader改为0,顺便问下博主你训练模型大概用多长时间,没有多线程操作训练真的很慢
- HAOLIN_ANDY回复仙凡兄 2021.03.12
  找了一下午的bug最后也是把numworker改成0，真的无语了
- 仙凡兄回复LLLLLuuusa 2020.12.12
  是的,windows是不能进行多线程操作，我使用的是4个1080GPU，训练的是yolov5s，epoch=300,1个多小时，epoch依次增加，基本按比例增加

博客等级

码龄6年

69
原创

59
点赞

118
收藏

47
粉丝

关注

私信

TA的精选

新跟着仙凡兄学习编译Telegram vs2022 2024.1.11编译成功
1816 阅读
新 ImportError: DLL load failed while importing imaging: 找不到指定的模块
598 阅读
热不能访问共享文件夹，但能ping通（win10)
10303 阅读
热查看ARM板子系统
7897 阅读
热 Windows远程桌面连线显示请稍后
4609 阅读

TA的历史创作历程

分类专栏

展开全部收起

上一篇：: cmake系列

下一篇：: 查看ARM板子系统

AI算力推荐

Yolo-v5

YOLO（You Only Look Once）是一种流行的物体检测和图像分割模型，由华盛顿大学的Joseph Redmon 和Ali Farhadi 开发。 YOLO 于2015 年推出，因其高速和高精度而广受欢迎

Yolo

目录

展开全部

收起

评论 7

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

查看更多评论

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。