目录
1.RuntimeError: Unable to find a valid cuDNN algorithm to run convolution
1.RuntimeError: Unable to find a valid cuDNN algorithm to run convolution
RuntimeError: Unable to find a valid cuDNN algorithm to run convolution
发生报错的原因是gpu内存占用过高
我们需要把bach_size调小,一般建议是8的倍数,内存不够用时尽量调低。
parser.add_argument('--batch-size', type=int, default=16, help='total batch size for all GPUs, -1 for autobatch')结果运行正常。
使用Yolov5模型时,s和n模型的深度和通道层数都比较小,batch-size设置的稍大一些,gpu可以跑的动,但使用l和x模型跑的时候就不一定可以跑的动了。使用指令nvidia-smi,根据gpu的使用情况调整batch-size的大小,尽量缩短每次训练模型的时间。
当遇到RuntimeError提示找不到有效的cuDNN算法运行卷积时,通常是由于GPU内存占用过高。解决方案是调整batch_size,通常建议设为8的倍数,并根据GPU使用情况,如使用Yolov5的s、n、l、x模型时,适当调整以确保训练过程顺利进行。可以使用nvidia-smi命令监控GPU状态并优化batch_size,以减少训练时间。
1707

被折叠的 条评论
为什么被折叠?



