Tensorflow训练出现could not create cudnn handle: CUDNN_STATUS_INTERNAL_ERROR 错误

最新推荐文章于 2021-06-07 14:30:42 发布

原创最新推荐文章于 2021-06-07 14:30:42 发布 · 2k 阅读

7 ·

CC 4.0 BY-SA版权

文章标签：

#could not create cudnn handle: #CUDA_ERROR_OUT_OF_MEMORY

Bug解决方案同时被 2 个专栏收录

21 篇文章

订阅专栏

TensorFlow

14 篇文章

订阅专栏

本文详细探讨了在使用TensorFlow 1.10版本进行GPU训练时遇到的内存管理问题，尤其是在batchsize设置为1的情况下，如何解决couldnotcreatecudnnhandle:CUDNN_STATUS_INTERNAL_ERROR错误。通过尝试多种配置，最终确定了一种有效的方法，即启用GPU内存自动增长功能。

部署运行你感兴趣的模型镜像

Tensorflow1.10 Gpu:2080 cuda:9

问题：

执行训练的时候，就算batchsize设置为1，也会出现一下问题

could not create cudnn handle: CUDNN_STATUS_INTERNAL_ERROR

解决办法：

搜了很多办法，下面罗列解决的办法

一、

config = tf.ConfigProto()
config.gpu_options.per_process_gpu_memory_fraction = 1.0
session = tf.Session(config=config, ...)

对于我来说不顶用......

二、
config = tf.ConfigProto() 
config.gpu_options.allow_growth = True 
sess = tf.Session(config=config)

对于我来说不顶用......

三、

执行 sudo rm -f ~/.nv 解决问题

对于我来说不顶用......

四、

以这种方式设置现存自动增长；我就是用这种方法解决的，

注意，这是和第二种方式不一样，绿色部分，根据tensorflow版本不同，import不同，我这里列举了两种；

from tensorflow.compat.v1 import ConfigProto
from tensorflow.compat.v1 import InteractiveSession

from tensorflow import ConfigProto
from tensorflow import InteractiveSession

config = ConfigProto()
config.gpu_options.allow_growth = True
session = InteractiveSession(config=config)

您可能感兴趣的与本文相关的镜像

TensorFlow-v2.15

TensorFlow

TensorFlow 是由Google Brain 团队开发的开源机器学习框架,广泛应用于深度学习研究和生产环境。它提供了一个灵活的平台,用于构建和训练各种机器学习模型

5 条评论

weixin_43865252 2022.10.27
感谢博主，按照最后一个方法成功解决！我猜测是锁了显存，运行时显存一超出限制就会报这个错误

阿委困的不能行 2020.09.11
您好，这个问题确实解决了，但是为啥是这样呢？

weixin_45785129 2020.02.23
终于加速成功，我也是前几个方法不顶用，最后一个解决了，谢谢

我才是一卓 2020.02.17
太好了，这个限制显存的方法终于让我走到下一个ERROR，很感谢！
- 搞视觉的张小凡回复我才是一卓 2020.02.18
  [reply]weixin_43667077[/reply]不客气，继续加油踏坑