Tensorflow1.10 Gpu:2080 cuda:9
问题:
执行训练的时候,就算batchsize设置为1,也会出现一下问题
could not create cudnn handle: CUDNN_STATUS_INTERNAL_ERROR
解决办法:
搜了很多办法,下面罗列解决的办法
一、
config = tf.ConfigProto() config.gpu_options.per_process_gpu_memory_fraction = 1.0 session = tf.Session(config=config, ...)
对于我来说不顶用......
二、 config = tf.ConfigProto() config.gpu_options.allow_growth = True sess = tf.Session(config=config)
对于我来说不顶用......
三、
执行 sudo rm -f ~/.nv 解决问题
对于我来说不顶用......
四、
以这种方式设置现存自动增长;我就是用这种方法解决的,
注意,这是和第二种方式不一样,绿色部分,根据tensorflow版本不同,import不同,我这里列举了两种;
from tensorflow.compat.v1 import ConfigProto
from tensorflow.compat.v1 import InteractiveSession
from tensorflow import ConfigProto
from tensorflow import InteractiveSession
config = ConfigProto()
config.gpu_options.allow_growth = True
session = InteractiveSession(config=config)

本文详细探讨了在使用TensorFlow 1.10版本进行GPU训练时遇到的内存管理问题,尤其是在batchsize设置为1的情况下,如何解决couldnotcreatecudnnhandle:CUDNN_STATUS_INTERNAL_ERROR错误。通过尝试多种配置,最终确定了一种有效的方法,即启用GPU内存自动增长功能。
2918





