【Error】Yolo 训练遇到的错误

最新推荐文章于 2024-06-13 16:47:00 发布

原创最新推荐文章于 2024-06-13 16:47:00 发布 · 1.4k 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#YOLO

Error 专栏收录该内容

1 篇文章

订阅专栏

当遇到RuntimeError提示找不到有效的cuDNN算法运行卷积时，通常是由于GPU内存占用过高。解决方案是调整batch_size，通常建议设为8的倍数，并根据GPU使用情况，如使用Yolov5的s、n、l、x模型时，适当调整以确保训练过程顺利进行。可以使用nvidia-smi命令监控GPU状态并优化batch_size，以减少训练时间。

部署运行你感兴趣的模型镜像

1.RuntimeError: Unable to find a valid cuDNN algorithm to run convolution

RuntimeError: Unable to find a valid cuDNN algorithm to run convolution

发生报错的原因是gpu内存占用过高

我们需要把bach_size调小，一般建议是8的倍数，内存不够用时尽量调低。
parser.add_argument('--batch-size', type=int, default=16, help='total batch size for all GPUs, -1 for autobatch')
结果运行正常。

使用Yolov5模型时，s和n模型的深度和通道层数都比较小，batch-size设置的稍大一些，gpu可以跑的动，但使用l和x模型跑的时候就不一定可以跑的动了。使用指令nvidia-smi，根据gpu的使用情况调整batch-size的大小，尽量缩短每次训练模型的时间。

您可能感兴趣的与本文相关的镜像