tensorflow-gpu报错：tensorflow.python.framework.errors_impl.UnknownError: 2 root error(s) found

原创已于 2023-03-27 12:59:29 修改 · 1.8k 阅读

7 ·

CC 4.0 BY-SA版权

文章标签：

#tensorflow #python #深度学习

于 2023-03-27 12:57:27 首次发布

本文详细记录了解决tensorflow-gpu运行时遇到的UnknownError问题的过程。尝试了检查tensorflow、CUDA和cuDNN版本一致性，分配显存及添加特定代码等方法，最终成功继续训练。尽管有人认为某代码可能使训练转为CPU，但对作者有效。

部署运行你感兴趣的模型镜像

一、报错内容

tensorflow.python.framework.errors_impl.UnknownError: 2 root error(s) found.
  (0) Unknown: Failed to get convolution algorithm. This is probably because cuDNN failed to initialize, so try looking to see if a warning log message was printed above.
	 [[{{node conv2d_24/convolution}}]]
  (1) Unknown: Failed to get convolution algorithm. This is probably because cuDNN failed to initialize, so try looking to see if a warning log message was printed above.
	 [[{{node conv2d_24/convolution}}]]
	 [[conv2d_46/truediv/_417]]
0 successful operations.
0 derived errors ignored.

二、解决方案

import keras
import tensorflow as tf
import os

os.environ["CUDA_VISIBLE_DEVICES"] = "1"#因为是单GPU训练，所以需要加上这一行代码
config = tf.ConfigProto()#t配置tf.Session的运算方式
config.gpu_options.allow_growth = True  # TensorFlow按需分配显存
config.gpu_options.per_process_gpu_memory_fraction = 0.5  # 指定显存分配比例
keras.backend.tensorflow_backend.set_session(tf.Session(config=config))

以上就是最终方案。

下面是解决的过程：

看了很多解决方案，解决方案可大致分为三类：

（1）查看tensorflow+cuda+cudnn安装版本是否一致，下面这篇文章里有教怎么查看是否一致。

Tensorflow、CUDA、cuDNN详细的下载安装过程_cudnn下载_机智的小神仙儿的博客-优快云博客

首先进入Tensorflow官网：在 Windows 环境中从源代码构建 | TensorFlow
找到windows对应的版本的模块，ctrl+F输入tensorflow

（2）tensorflow按需分配显存

import keras
import tensorflow as tf

config = tf.ConfigProto()#t配置tf.Session的运算方式
config.gpu_options.allow_growth = True  # TensorFlow按需分配显存
config.gpu_options.per_process_gpu_memory_fraction = 0.5  # 指定显存分配比例
keras.backend.tensorflow_backend.set_session(tf.Session(config=config))

这个类似的来源太多了，就先不标注了。

这个方案我试了，但还是没解决问题。

（3）由于单GPU训练，因此加上一行代码

import os
os.environ["CUDA_VISIBLE_DEVICES"] = "1"

源自：tensorflow-gpu测试报错：tensorflow.python.framework.errors_impl.UnknownError: 2 root error(s) found_喜欢小黄鸭的焦哥的博客-优快云博客

所以最后把（2）和（3）结合了一下，成功继续训练。

不过，这篇文章有人评论说是加上这行代码会变成cpu？我不太确定，有大佬知道的可以留言交流一下。

对我来说，最后可算是继续训练了/撒花

记录一下运行的又一个坎。

您可能感兴趣的与本文相关的镜像

PyTorch 2.9

PyTorch

Cuda

PyTorch 是一个开源的 Python 机器学习库，基于 Torch 库，底层由 C++ 实现，应用于人工智能领域，如计算机视觉和自然语言处理

7 条评论

henrenzhendehuan 2024.12.25
这个好像是cdnn版本不对导致的，我前面用这个cuda_visible_devices =“1”还是cpu占用100%gpu没用，换了一个高一点的cdnn就好了，就是gpu100%占用了（用win+r看的）

henrenzhendehuan 2024.12.24
好像真是cpu，我用另一个电脑跑速度快很多，主要是看日志的时候报的是用的cpu

一条自由自在的小鱼儿 2023.04.18
不知道有没有用，不过确实能训练了，谢谢博主

python小白Q 2023.04.09
试完了是由GPU变成CPU了

优快云-Ada助手 2023.03.28
推荐 Python入门技能树：https://edu.youkuaiyun.com/skill/python?utm_source=AI_act_python

优快云-Ada助手 2023.03.28
恭喜你这篇博客进入【优快云每天最佳新人】榜单，全部的排名请看 https://bbs.youkuaiyun.com/topics/614290885。

laxyer 2023.03.27
看了这篇文章，应该还是gpu。 https://blog.youkuaiyun.com/qq_34243930/article/details/106695877