当你遇到failed to create cublasLt handle: CUBLAS_STATUS_INTERNAL_ERROR

最新推荐文章于 2024-11-05 11:32:22 发布

原创最新推荐文章于 2024-11-05 11:32:22 发布 · 1.1k 阅读

5 ·

CC 4.0 BY-SA版权

文章标签：

#tensorflow #深度学习 #人工智能

作者分享了解决TensorFlow 2.0在NVIDIA 3060 GPU上运行问题的方法，包括检查版本兼容性和通过设置CUDA_VISIBLE_DEVICES环境变量。建议在遇到类似问题时参考此经验。

部署运行你感兴趣的模型镜像

这段时间在搞深度学习，代码在别人的电脑上的tensorflow1.0版本上可以正常运行

但是自己的3060不知道为啥就是不行，一查好像是3060不支持CDUA10.0以下版本

那咱就装2.0呗，装了之后一直报这个错误，查了一万种方法都不知道咋解决

今天终于解决了，分享出来让大家少浪费一点时间

遇到这个问题有两种解法

1.看看你的tensorflow版本和cuda以及cudnn版本是否吻合

我是3060+tensorflow-gpu2.4.1+cuda11.1+cudnn8.04/8.05

2.确认都对了以后，在代码最上方加入

import os

os.environ["CUDA_VISIBLE_DEVICES"] = "1"

OK，问题解决

您可能感兴趣的与本文相关的镜像

PyTorch 2.5

PyTorch

Cuda

PyTorch 是一个开源的 Python 机器学习库，基于 Torch 库，底层由 C++ 实现，应用于人工智能领域，如计算机视觉和自然语言处理

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Camileyml

关注关注

4
点赞
踩
5

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

tensorflow-gpu版本运行出错：failed to create cublas handle: CUBLAS_STATUS_INTERNAL_ERROR

布布汪的博客

06-15

5887

2020-06-15 20:50:15.674461: E tensorflow/stream_executor/cuda/cuda_blas.cc:238] failed to create cublas handle: CUBLAS_STATUS_INTERNAL_ERROR 2020-06-15 20:50:15.675589: E tensorflow/stream_executor/cuda/cuda_blas.cc:238] failed to create cublas handle: CUB

问题处理failed to create cublas handle: CUBLAS_STATUS_ALLOC_FAILED

smallwhite620451的博客

03-11

1078

failed to create cublas handle: CUBLAS_STATUS_ALLOC_FAILED 报警告问题的解决 MY question：总是抱这个错，但是我的gpu并没有被占用，找了一些方法，网上最多的那种方法总是提示ConfigProto有问题然后找到了下面的解决方法，虽然也会跳红色的但是最后不会提示显存不足，会正常训练！如果有谁知道这个红色的部分怎么解决，望告知，谢谢！转自：https://www.tqwba.com/x_d/jishu/202284.html

1 条评论您还未登录，请先登录后发表或查看评论

2 条评论

m0_70390362 2023.12.23
为啥是1而不是0，主卡默认不是0嘛

failed to create cublas handle: CUBLAS_STATUS_ALLOC_FAILED 报错（解决方法）

Welcome

11-16

2098

1.报错问题：（来自GCN_Keras-master代码）在Pycharm运行GCN_Keras代码的时候，报错： ①Your CPU supports instructions that this TensorFlow binary was not compiled to use: AVX2 FMA 您的CPU支持该TensorFlow二进制文件未编译为使用的指令：AVX2 FMA 原因：成功解决Your CPU supports instructions that this TensorF.

failed to create cublas handle: CUBLAS_STATUS_ALLOC_FAILED

WEXIA666的博客

09-02

2352

failed to create cublas handle: CUBLAS_STATUS_ALLOC_FAILED问题的解决 failed to create cublas handle: CUBLAS_STATUS_ALLOC_FAILED 报警告问题的解决最近在跑keras的时候，发现配置好的cuda和cudnn，在tensorflow-gpu 2.3.0的情况下，老是会报出一个警告failed to create cublas handle: CUBLAS_STATUS_ALLOC_FAILED

【Tensorflow】failed to create cublas handle: CUBLAS_STATUS_ALLOC_FAILED

一名混沌的大学生

03-04

457

CUBLAS_STATUS_ALLOC_FAILED

Keras和TensorFlow中failed to create cublas handle: CUBLAS_STATUS_NOT_INITIALIZED问题解决

heenim33的博客

06-03

8497

运行示例代码时，可以正常使用GPU，但是在运行某些代码时，会出现，failed to create cublas handle: CUBLAS_STATUS_NOT_INITIALIZED 的问题，可能是由于显存不够而造成的。 1、TensorFlow 在使用sess前，加上如上的配置。 config = tf.ConfigProto() config.gpu_options.allow_growth = True config.gpu_options.per_process_gpu_memo

运行keras时出现Could not create cudnn handle: CUDNN_STATUS_INTERNAL_ERROR的原因和解决方法

Pieux的博客

08-05

9403

Tensorflow和Keras的关系在正式进入这个问题之前，我们先来了解一下tensorflow和keras之间的关系，因为后面会用到这个地方的知识。首先，tensorflow和keras都是深度学习框架，当你遇到上面这个问题的时候表明你至少用过两者之一。其次，tensorflow相较于keras更偏向于底层，而keras封装性更好，类似于接口。 keras是在tensorflow的基础上建立起来的,可以把keras看做tensorflow或者theano(已经停更的深度学习框架)的接口

could not create cudnn handle: CUDNN_STATUS_INTERNAL_ERROR

DDB

09-11

1143

当我们深度学习做训练的时候，偶尔会发生这种情况，我把源错误贴出来： Epoch 1/16 2019-09-11 09:34:11.000335: E C:\users\nwani\_bazel_nwani\mmtm6wb6\execroot\org_tensorflow\tensorflow\stream_executor\cuda\cuda_dnn.cc:455] could not creat...

failed to create cublas handle: CUBLAS_STATUS_NOT_INITIALIZED

DY_JY的博客

04-06

2414

报错提示：failed to create cublas handle: CUBLAS_STATUS_NOT_INITIALIZED 今天跑yolov4程序时，在predict图片时，出现了如上的报错。查阅资料后发现，该报错是指没有分配显存或显存不够的时候才会报。 ##在用gpu跑程序时，如果没有手动分配显存的话，默认能占多少占多少，但是占用过多可能会导致系统运行出错。所以给我们整了个报错.解决方案参考的该博主的config的说明，链接贴在后面。代码如下： physical_devices = tf.co

解决：failed to create cublas handle: CUBLAS_STATUS_ALLOC_FAILED

Amigo_1997的博客

03-26

8610

今天测试tensorflow的GPU版本，但是发现一个问题同一个程序（卷积神经网络）为什么在anaconda里的jupyter里就可以飞速跑完，在使用anaconda环境的pycharm里面就会说显存不足呢？报错是：failed to create cublas handle: CUBLAS_STATUS_ALLOC_FAILED（这就是显存不足的意思）两个解决方案：（1） ...

TensorFlow—GPU版本运行报错：failed to create cublas handle: CUBLAS_STATUS_ALLOC_FAILED

锅盖小郭哥

02-23

3308

报错： 2021-02-23 00:00:47.646531: E tensorflow/stream_executor/cuda/cuda_blas.cc:238] failed to create cublas handle: CUBLAS_STATUS_ALLOC_FAILED 原因：此时说明你电脑显存占用过高，已经不足！! 如果继续全负载跑比较复杂的TensorFlow网络模型则会导致电脑其他软件运行失败，起到保护电脑的作用。解决：需要在初始化 Session 的时候为其分配固定数量

failed to create cublas handle: CUBLAS_STATUS_ALLOC_FAILED 错误解决方法

星之所望的博客

11-23

4028

如果你是使用 GPU 版 TensorFlow 的话，并且你想在显卡高占用率的情况下（比如玩游戏）训练模型，那你要注意在初始化Session的时候为其分配固定数量的显存，否则可能会在开始训练的时候直接报错退出： 2017-06-27 20:39:21.955486: E c:\tf_jenkins\home\workspace\release-win\m\windows-gpu\py\35...

failed to create cublas handle: CUBLAS_STATUS_ALLOC_FAILED

xiongzai2016的博客

11-26

2589

failed to create cublas handle: CUBLAS_STATUS_ALLOC_FAILED 错误解决方法

H100 使用bitsandbytes 进行模型 8Bit 量化时遇到报错：Exception: cublasLt ran into an error!

weixin_43667338的博客

11-05

830

根据git issue的讨论，这个问题实际上是 bitsandbytes 库对 H100/H800 这类 Hopper 架构 GPU 的 8-bit 量化不支持的根本问题。这个问题目前仍然处于开放状态，官方团队正在考虑对 Hopper 架构的支持。如果必须在 H100/H800 上运行，建议使用 4-bit 量化作为替代方案。硬件级别的兼容性问题无法通过代码优化来解决。

【解决问题】【Tensorflow】failed to create cublas handle: CUBLAS_STATUS_ALLOC_FAILED

qq_45954434的博客

11-09

6457

【解决问题】【深度学习】failed to create cublas handle: CUBLAS_STATUS_ALLOC_FAILED前言问题描述解决问题参考链接前言学了好多天的深度学习，终于学到使用gpu了，本来很开心，但是和同学聊天得知我的1660Ti跑深度学习，啥也不是，顿是不抱什么希望了，笔记本用来学习就好了，真跑深度学习还得用实验室电脑，哎问题描述使用gpu时出现了报错 2021-11-09 20:43:26.114720: I tensorflow/stream_executor/

cublasCreate(&cublas_handle) == CUBLAS_STATUS_SUCCESS Failed to create cuBlas instance

乐趣是人为构建的，构建是一种莫大的乐趣。

04-26

500

123

解决Keras的failed to create cublas handle: CUBLAS_STATUS_ALLOC_FAILED、attempting to perform BLAS operat

CJW的博客

04-20

2828

利用多进程进行多模型模拟组合预测，出现以下问题： E tensorflow/stream_executor/cuda/cuda_blas.cc:238] failed to create cublas handle: CUBLAS_STATUS_ALLOC_FAILED W tensorflow/stream_executor/stream.cc:1916] attempting to perform BLAS operation using StreamExecutor without BLAS supp

2025-03-31 22:41:03.291450: I tensorflow/core/platform/cpu_feature_guard.cc:193] This TensorFlow binary is optimized with oneAPI Deep Neural Network Library (oneDNN) to use the following CPU instructions in performance-critical operations: AVX AVX2 To enable them in other operations, rebuild TensorFlow with the appropriate compiler flags. 2025-03-31 22:41:03.720901: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1532] Created device /job:localhost/replica:0/task:0/device:GPU:0 with 4096 MB memory: -> device: 0, name: NVIDIA GeForce RTX 3060 Laptop GPU, pci bus id: 0000:01:00.0, compute capability: 8.6 2025-03-31 22:41:04.194585: E tensorflow/stream_executor/cuda/cuda_blas.cc:242] failed to create cublasLt handle: CUBLAS_STATUS_INTERNAL_ERROR 2025-03-31 22:41:04.194916: W tensorflow/core/framework/op_kernel.cc:1745] OP_REQUIRES failed at matmul_op_impl.h:442 : INTERNAL: Attempting to perform BLAS operation using StreamExecutor without BLAS support Traceback (most recent call last):

最新发布

04-01

<think>好的，我现在需要帮助用户解决TensorFlow中出现的CUBLAS_STATUS_INTERNAL_ERROR错误以及BLAS操作失败的问题。首先，我得仔细分析用户提供的信息和错误提示，然后结合自己的知识库来找出可能的原因和解决方案。用户提到的错误信息是CUBLAS_STATUS_INTERNAL_ERROR，这个错误通常与CUDA和cuBLAS库有关。根据引用[1]，用户之前检查过GPU是否支持CUDA，但发现不支持，所以换了卡。不过现在可能还是遇到了问题。这说明用户的GPU可能仍然存在兼容性或配置问题。接下来，我需要考虑可能导致这个错误的原因。首先，用户的GPU驱动是否正确安装？CUDA工具包和cuDNN库的版本是否与TensorFlow兼容？TensorFlow的不同版本对CUDA和cuDNN有特定要求，如果版本不匹配，就会导致这类错误。另外，用户可能在运行过程中显存不足，或者有其他进程占用了显存，导致cuBLAS无法分配足够的资源。此外，代码中的批量大小设置过大也可能耗尽显存，从而引发错误。然后，用户提到的另一个引用[2]中提到了编译时的链接选项，如-lm、-lrt等，这些可能与静态链接库有关。如果在编译TensorFlow或相关库时使用了不正确的链接选项，可能会导致运行时库加载失败，进而出现BLAS错误。针对这些可能的原因，我需要逐步给出解决方案。首先检查CUDA、cuDNN与TensorFlow的版本兼容性，确保它们完全匹配。然后建议用户更新或重新安装GPU驱动、CUDA和cuDNN。接着，检查显存使用情况，调整批量大小或释放显存资源。此外，验证代码中的依赖库是否正确安装，并确保环境变量如LD_LIBRARY_PATH正确设置。如果问题仍然存在，建议用户尝试在干净的虚拟环境中重新安装TensorFlow，或者使用Docker镜像以避免环境冲突。最后，若所有方法都无效，可能需要进一步检查硬件问题或寻求官方支持。在生成相关问题部分，我需要围绕用户可能进一步询问的方向展开，比如如何检查版本兼容性、显存管理方法、环境变量设置、代码调试技巧等，以帮助用户全面解决问题。</think>### TensorFlow CUBLAS_STATUS_INTERNAL_ERROR错误解决方案 #### 1. 验证GPU与CUDA兼容性 - **步骤说明**：确保GPU支持CUDA且驱动版本匹配。使用命令`nvidia-smi`查看驱动版本，并通过[NVIDIA官网](https://developer.nvidia.com/cuda-toolkit-archive)确认CUDA工具包与驱动的兼容性。 - **示例**： ```bash nvidia-smi # 查看驱动版本和GPU状态 cat /usr/local/cuda/version.txt # 查看CUDA版本 ``` - **关键点**：TensorFlow版本需严格匹配CUDA和cuDNN版本，例如TensorFlow 2.10要求CUDA 11.2和cuDNN 8.1[^1]。 #### 2. 检查cuBLAS依赖项 - **步骤说明**：验证`libcublas.so`库文件是否存在且路径正确。使用`ldconfig -p | grep cublas`检查动态库链接。 - **示例**： ```bash find /usr -name "libcublas.so*" # 查找cuBLAS库路径 export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH # 添加环境变量 ``` - **关键点**：若编译时使用了`-static`参数（如引用[2]中的`-static-libgcc`），可能导致动态库加载失败，需改用动态链接。 #### 3. 显存资源管理 - **步骤说明**：通过减少批量大小或清理显存占用解决资源不足问题。使用`tf.config.experimental.set_memory_growth`启用显存动态分配。 - **代码示例**： ```python gpus = tf.config.experimental.list_physical_devices('GPU') if gpus: try: for gpu in gpus: tf.config.experimental.set_memory_growth(gpu, True) except RuntimeError as e: print(e) ``` #### 4. 环境隔离与重装 - **步骤说明**：使用虚拟环境或Docker容器隔离依赖项冲突。 - **示例**： ```bash # 创建虚拟环境 python -m venv tf_env source tf_env/bin/activate pip install tensorflow-gpu==2.10.0 # 指定兼容版本 # 使用NVIDIA官方Docker镜像 docker run --gpus all -it tensorflow/tensorflow:2.10.0-gpu ``` #### 5. 调试代码与日志分析 - **步骤说明**：启用TensorFlow详细日志输出，定位具体报错位置。 - **示例**： ```python import os os.environ['TF_CPP_MIN_LOG_LEVEL'] = '0' # 开启所有日志 tf.debugging.set_log_device_placement(True) # 显示设备分配信息 ```