CUDNN_STATUS_INTERNAL_ERROR的解决办法
产生原因
Tensorflow CUDNN的内存分配错误从而引发的
解决办法
执行下行代码
export TF_FORCE_GPU_ALLOW_GROWTH=true
allow_growth 不进行设定的话,GPU的memory将全部使用因此会导致显存分配错的的情况时有发生。通过启动allow_growth = true确保使用量从而避免错误发生。
也就是分配器不会指定所有的GPU显存空间,而是根据模型需求增长。
参考
https://github.com/tensorflow/tensorflow/issues/24496#issuecomment-455265295

本文探讨了Tensorflow中CUDNN_STATUS_INTERNAL_ERROR的产生原因,即CUDNN的内存分配错误,并提供了解决方案:通过设置TF_FORCE_GPU_ALLOW_GROWTH=true,使GPU显存按需动态增长,避免全量分配导致的错误。
5307

被折叠的 条评论
为什么被折叠?



