
深度学习报错调试合集
文章平均质量分 60
记录笔者在跑深度学习时,遇到各种各样的问题和解决办法。
AiCharm
新星计划第三季人工智能赛道第一名-人工智能领域实力新星获得者,阿里云社区博客专家,华为云享专家
展开
-
解决numpy.core._exceptions.MemoryError: Unable to allocate 1.04 MiB for an array
报错numpy.core._exceptions.MemoryError: Unable to allocate 1.04 MiB for an array with shape (370, 370) and data type float64原因最主要的还是电脑内存不足,因为需要处理的数据量太大,GPU性能不够,存在内存溢出现象但实际上它保存的不是模型文件,而是参数文件文件。在模型文件中,存储完整的模型,而在状态文件中,仅存储参数。因此,collections.OrderedDict只是模型的值原创 2022-06-06 09:00:00 · 71344 阅读 · 10 评论 -
解决AttributeError: ‘model‘ object has no attribute ‘copy‘
错误AttributeError: 'model' object has no attribute 'copy'原因原因是没有使用model.state_dict()进行模型保存,但是使用了model.load_state_dict()加载模型。这两者要配套使用。解决方案使用一下的方式保存、加载模型#保存模型torch.save( my_resnet.state_dict(),"model.pth")#加载模型model.load_state_dict(torch.Load("model原创 2022-05-29 09:00:00 · 3290 阅读 · 0 评论 -
解决AttributeError: ‘collections.OrderedDict‘ object has no attribute ‘eval‘
报错AttributeError: ‘collections.OrderedDict‘ object has no attribute ‘eval‘原因这个错误的原因就是说你这个collecttions的类对象没有eval这个属性。绝大部分原因是因为使用了下面语句来保存模型。torch.save(model.state_dict(),model_path)但实际上它保存的不是模型文件,而是参数文件文件。在模型文件中,存储完整的模型,而在状态文件中,仅存储参数。因此,collections.O原创 2022-05-28 09:00:00 · 30622 阅读 · 4 评论 -
解决RuntimeError: Expected all tensors to be on the same device, but found at least two devices, cp
今天在把.pt文件转ONNX文件时,遇到此错误。报错RuntimeError: Expected all tensors to be on the same device, but found at least two devices, cpu and cuda:0! (when checking argument for argument mat2 in method wrapper_mm)原因代码中的Tensor**,一会在CPU中运行,一会在GPU中运行**,所以最好是都放在同一个devic原创 2022-05-26 09:00:00 · 65712 阅读 · 6 评论 -
bash: cd: too many arguments 报错解决方法
今天在服务器上跑程序的时候,cd进文件夹的时候出错了。错误bash: cd: too many arguments经过查找发现原因:路径名或者变量有空格时候,会造成参数太多的错误提示解决方法:把空格的地方用引号包括起来...原创 2022-05-09 09:00:00 · 24033 阅读 · 0 评论 -
raise RuntimeError(‘Error(s) in loading state_dict for {}:\n\t{}‘.format( RuntimeError: Error(s)..报错
今天在跑基于VGG16的迁移学习的时候,遇到错误。 raise RuntimeError('Error(s) in loading state_dict for {}:\n\t{}'.format(RuntimeError: Error(s) in loading state_dict for VGG16_SE:原因加载预训练权重的过程中因为没使用VGG的其他的一些层的预训练权重,bias。产生了一个错误。解决方案我们只需要加一个strict=False这个参数即load_state_di原创 2022-05-10 09:00:00 · 18787 阅读 · 4 评论 -
ImportError: cannot import name ‘get_config‘ from ‘tensorflow.python.eager.context‘ 报错解决
今天在跑高光谱分类SOTA模型SpectralNET《SpectralNET a 2D wavelet CNN for Hyperspectral Image Classification》时遇到一个问题。报错信息:ImportError: cannot import name 'get_config' from 'tensorflow.python.eager.context'报错原因:Keras版本不符模型中的Keras版本为2.4.3,我安装的时候直接pip install Keras默原创 2022-05-05 09:00:00 · 2908 阅读 · 1 评论 -
加载模型出现-RuntimeError: Error(s) in loading state_dict for Net:unexpected key(s) in state_dict: XXX
加载模型时发生错误RuntimeError: Error(s) in loading state_dict for Net:unexpected key(s) in state_dict: XXXTraceback (most recent call last): File "demo.py", line 380, in <module> model.load_state_dict(torch.load('./0428.pth')) File "/root/miniconda原创 2022-05-04 09:00:00 · 7543 阅读 · 9 评论 -
TensorFlow训练报错:ResourceExhaustedError: OOM when allocating tensor device:GPU:0 by allocator G
使用TensorFlow训练某些较大模型时会发生内存溢出,如果 已经安装了TensorFlow-GPU版本,训练时会优先调用GPU版本的TensorFlow,而一般电脑上显存比较小,很容易发生溢出,就会出现如下报错:ResourceExhaustedError: OOM when allocating tensor with shape[1024,728,1,1] and type float on /job:localhost/replica:0/task:0/device:GPU:0 by allo原创 2022-05-02 09:00:00 · 2266 阅读 · 1 评论 -
PyTorch可视化利器Visdom
PyTorch可视化工具Visdom1.介绍2.安装与启动2.1 安装2.2 启动3.相关概念3.1 窗口3.2 回调4.可视化实战4.1 加载相关库4.2 可视化步骤4.3 可视化单一数据4.4 可视化多类数据4.5 可视化图像5. Visdom APIvis.imagevis.textvis.videovis.svgvis.savevis.scattervis.linevis.updateTracevis.stemvis.heatmapvis.barvis.histogramvis.boxplotvis原创 2022-04-28 09:00:00 · 1391 阅读 · 0 评论 -
深度学习部署:Windows安装pycocotools报错解决方法
深度学习部署:Windows安装pycocotools报错解决方法1.pycocotools库的简介2.pycocotools安装的坑3.解决办法本系列是作者在跑一些深度学习实例时,遇到的各种各样的问题及解决办法,希望能够帮助到大家。1.pycocotools库的简介 pycocotools即python api tools of COCO。COCO是一个大型的图像数据集,用于目标检测、分割、人的关键点检测、素材分割和标题生成。这个包提供了Matlab、Python和luaapi,这些api有助于在原创 2022-03-17 16:22:33 · 14563 阅读 · 8 评论