前言
本文记录了YOLOv13模型的环境搭建、模型训练、模块改进、论文写作这一系列过程中可能发生的问题,以及大家非常关心的论文创新性问题,这里统一做了一个记录和解答。
专栏目录:YOLOv13改进目录一览 | 涉及卷积层、轻量化、注意力、损失函数、Backbone、SPPF、Neck、检测头等全方位改进
文章目录
- 前言
- 一、报错处理
-
- 1. RuntimeError: CUDA out of memory.
- 2. OSError: [WinError 1455] 页面文件太小,无法完成操作
- 3. 通道数不匹配以及完整按照专栏内容修改却还是报错
- 4. 无法打印GFLOPs
- 5. 训练过程中,损失均为nan,mAP评价指标均为0
- 6. RuntimeError: Input type (torch.cuda.HalfTensor) and weight type (torch.cuda.FloatTensor) should be the same
- 7. 安装mmcv报错
- 8. RuntimeError: Couldn’t load custom C++ ops.
- 9. NameError: name ' XXX ' is not defined
- 10. IndexError: index 0 is out of bounds for dimension 0 with size 0
- 11. TypeError: __init__() missing 1 required positional argument: 'ch'
- 12. 与torch相关的报错
- 13. ModuleNotFoundError: No module named ‘pywt’
- 14. _pickle.UnpicklingError: STACK_GLOBAL requires str
- 15. 新建虚拟环境报错:CondaHTTPError
- 16. 多卡训练报错
- 17. 训练过程中报尺寸不匹配的错误
- 18. 推理过程中报尺寸不匹配的错误
- 19. RuntimeError: cuDNN error: CUDNN_STATUS_NOT_INITIALIZED
- 20. 按照专栏配置完成后,n,s,m版本可以运行,l,x版本报通道数错误
- 二、疑问解答
-
- 1. pip 安装模块时下载很慢,怎么办?
- 2. 初始训练精度较低,一直上不去怎么办?
- 3. 模型训练配置的参数和default.yaml文件中的参数有什么关系?
- 4. 我训练的是YOLOv13,但是打印的AMP却是使用的是 YOLOv8n,这个有影响吗?
- 5. 一切都运行正常,但在测试时,测试的图片中无法检测到目标,为什么?
- 7.如何查看训练完模型的参数量、计算量、精度、速度等指标?
- 8.文章中所改进的模块我可不可以加到其他位置?
- 9. 每一个模块有没有推荐添加的位置?
- 10. 模型训练的数据集大小有没有要求?
- 11. 发表论文需要多大的创新?
- 12. 是否要使用预训练的权重进行训练?
- 13. ...
一、报错处理
1. RuntimeError: CUDA out of memory.
报错提示:
RuntimeError: CUDA out of memory. Tried to allocate 58.00 MiB (GPU 0; 31.74 GiB total capacity; 30.02 GiB already allocated; 42.88 MiB free; 30.24 GiB reserved in total by PyTorch)
解决方案:
超出内存。这是由于batch_size设置的过大,超出CUDA处理能力范围。需调小。
当然,调小后,速度就会变慢,这也就是为什么大家都用性能好的卡了。
2. OSError: [WinError 1455] 页面文件太小,无法完成操作
报错提示:
OSError: [WinError 1455] 页面文件太小,无法完成操作
解决方案:
在参数配置中,w
订阅专栏 解锁全文
314

被折叠的 条评论
为什么被折叠?



