(Caffe | Windows10) Check failed: error == cudaSuccess (8 vs. 0) invalid device function

原创于 2021-03-15 19:00:26 发布 · 392 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#cuda #深度学习 #caffe

环境配置专栏收录该内容

5 篇文章

订阅专栏

本文解决了在安装Caffe-GPU版本过程中遇到的Checkfailed:error==cudaSuccess(8vs.0)invaliddevicefunction错误。针对现代显卡如GTX1650（图灵架构），建议忽略官网推荐的CUDA8，而采用CUDA10.2+cudnn7.6.5进行安装。

部署运行你感兴趣的模型镜像

在安装caffe-gpu版本的时候出现的Check failed: error == cudaSuccess (8 vs. 0) invalid device function的问题。

原因分析

由于Caffe已经很久没有更新了，所以官网上推荐的CUDA和cudnn版本任停留在CUDA8和cudnn5.1的状态，而现在机器中的显卡架构的更新可能导致无法成功安装Caffe-GPU版本。

比如本人的笔记本显卡为GTX1650，是图灵（Turing）架构，同架构的还有GTX16系列和RTX20系列。图灵架构的显卡算力较强，且基本只支持CUDA10以上的版本。

问题解决

经过测试，本人已经成功在CUDA10.2+cudnn7.6.5版本下安装了Caffe-GPU，具体内容可以查看Caffe-GPU。所以遇到以上情况可以无视官网介绍的使用CUDA8的需求，直接安装CUDA10即可。

其他

如果电脑内（Win10系统）安装其他版本的CUDA，可以在系统环境变量中修改，可以参考https://blog.youkuaiyun.com/zhaotun123/article/details/99680151

您可能感兴趣的与本文相关的镜像

PyTorch 2.9

PyTorch

Cuda

PyTorch 是一个开源的 Python 机器学习库，基于 Torch 库，底层由 C++ 实现，应用于人工智能领域，如计算机视觉和自然语言处理

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

lostcorner

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

caffe深度学习【十八】Check failed: error == cudaSuccess (8 vs. 0) invalid device function

volcano_Lin 的博客

11-26

2504

今天想跑一下行为识别的C3D算法，但是发现出现如下错误： Check failed: error == cudaSuccess (8 vs. 0) invalid device function 查了下原因，网上说是最大能力编译版本不对，如果提示invaild argument，说明batchsize还是太大了，爆了缓存而我的是invalid device functi...

ubuntu16.04+GTX1660深度学习相关配置

random_repick的专栏

11-06

2712

1.前情提要本文使用cuda10.1，cuda8不行，cuda9没试过 cudnn要使用显卡以后发布的版本考虑到官网总是挂，可以在此下载cuda10.1，cudnn cudnn的developer版本安装失败，runtime版本缺少头文件，所以安装runtime版本，使用developer版本是头文件，注意头文件的命名 2.编译caffe遇到的问题 1、Check failed: err...

参与评论您还未登录，请先登录后发表或查看评论

Check failed: error == cudaSuccess (8 vs. 0) invalid device function

wzy的博客

02-23

2926

最近在复现R-CNN一系列的实验时，配置代码环境真是花费了不少时间。由于对MATLAB不熟悉，实验采用的都是github上rbg大神的Python版本。在配置Faster R-CNN时，编译没有问题，一运行 ./tools/demo.py --net zf 就会出现如下错误： [plain] view plain copy Loaded network ./

Run Caffe Meet [Check failed: error == cudaSuccess (8 vs.0) invalid device function]

weixin_30514745的博客

05-10

308

It is possible relative to CUDA compute cabality , and should find yourVGA Driver'scompute cabality You can refer to is Blog: http://blog.csdn.net/real_myth/article/details/44308169 And then...

精选资源

Check failed: error == cudaSuccess (74 vs. 0) misaligned address

01-08

以下摘自github hoszbh的回答 https://github.com/BVLC/caffe/issues/5729 modifying cudnn_conv_layer.cpp and aligning the address to be multiples of 32. You can insert tow lines of code before size_t ...

Caffe常见问题解决：NuGet Error,无法打开输入文件“opencv_calib3d240d.lib”

热门推荐

灰羽的博客

09-18

3万+

最近学习Windows平台下的Caffe，自然而然地选择了微软提供的版本。该版本由于通过NuGet进行三方组件的安装与管理，设置上按理说会更加简便一些。不过在配置过程中还是遇到了相当的问题，这里介绍一下可能比较常见的几个问题是如何被最终解决的。编译环境：VS2013This project references NuGet package(s) that are missing on thi

caffe 训练安装测试问题集锦

zhanghenan123的博客

07-19

2212

1、Check failed: target_blobs.size() == source_layer.blobs_size() (2 vs. 1) Incompatible number of blobs for layer conv0 测试的时候出现此问题 2、cudaSuccess(2 vs. 0) out of memory,如下图这种问题为显存不足导致的，出现这种问题有以下几...

caffe-windows10 安装问题 Check failed: error == cudaSuccess (8 vs.0) invalid device function

theodoreyu的博客

10-16

587

caffe.exe has stopped working

caffe gpu官方镜像报错cudaSuccess (8 vs. 0) invalid device function

b625846910的博客

02-02

444

镜像版本 bvlc/caffe:gpu 镜像中cuda运行时版本：8.0 cuda driver version: 11.0 使用caffemnist测试镜像，结果报如下错误： Check failed: error == cudaSuccess (8 vs. 0) invalid device function 我的gpu是2080ti，支持的计算能力范围比较广，不知道为什么报上面的错误。解决办法：保持caffe Makefile.config.example中的CUD...

Check failed: error == cudaSuccess (8 vs. 0) invalid device function

qq_20481015的博客

11-01

1700

caffe正常能用，但是运行过程中，报错Check failed: error == cudaSuccess (8 vs. 0) invalid device function。事实上，出现这种问题是编译时，显卡的计算能力没有设置好。按照自己的显卡修改Makefile.config的这个位置即可 CUDA_ARCH := -gencode arch=compute_20,code=sm_...

caffe运行错误： im2col.cu:61] Check failed: error == cudaSuccess (8 vs. 0) invalid device function

junmuzi的专栏

10-21

3454

original url: http://www.bubuko.com/infodetail-2265238.html 错误： im2col.cu:61] Check failed: error == cudaSuccess (8 vs. 0) invalid device function 原因：由于Makefile.config里面只对cuda8.0以下

caffe运行错误： im2col.cu:61] Check failed: error == cudaSuccess (8 vs. 0) invalid device function...

weixin_34085658的博客

08-17

288

错误： im2col.cu:61] Check failed: error == cudaSuccess (8 vs. 0) invalid device function 原因：由于Makefile.config里面只对cuda8.0一下的架构编译cuda程序，所以采用cuda8.0后cuda程序没有被编译解决：修改Makefile.config中的 CUDA_ARCH 添加-g...

jetson TX2报错 error==cudaSuccess(8 vs. 0) invalid device function

zhaoyaohuahua的博客

10-28

3336

查阅资料，显示此问题为显卡计算能力不匹配造成，在caffe目录下的Makefile.config文件当中做修改，原始的文件第35行（我的文件）CUDA_ARCH项是这样的。（看到教程说要删掉sm_20,sm_21两行，图片是删掉之后的）。如题报错然而无能的我上官网并没有找到TX2的计算能力，经过几番周折，在某个网页看到Jetson TX2计算能力为6.2，由于太过激动，一时不慎关掉网

caffe error in windows: Check failed: status == CUBLAS_STATUS_SUCCESS (13 vs. 0) CUBLAS_STATUS_EXECUTION_FAILED

最新发布

12-15

在Windows系统下，Caffe出现 `Check failed: status == CUBLAS_STATUS_SUCCESS (13 vs. 0) CUBLAS_STATUS_EXECUTION_FAILED` 错误通常与CUDA和cuBLAS库相关，以下是一些可能的解决办法： #### 1. 检查cuBLAS库文件确保cuBLAS库文件（如 `cublas64_xx.dll` 和 `cublasLt64_xx.dll`，`xx` 代表版本号）正确安装并且路径被系统识别。可以尝试将 `cublas64_10.dll` 与 `cublasLt64_10.dll` 文件复制到 `C:\Windows\System32` 中，然后运行Caffe程序。复制完文件后通过运行检查代码来确认问题是否解决，例如运行 `paddle.utils.run_check()` 来辅助确认系统环境是否正常（虽然 `paddle.utils.run_check()` 主要用于PaddlePaddle，但可以侧面反映环境情况） [^1]。 #### 2. 版本兼容性确保CUDA、cuBLAS和Caffe的版本相互兼容。不兼容的版本可能会导致cuBLAS执行失败。可以参考Caffe的官方文档来确定所支持的CUDA和cuBLAS版本，然后安装对应的版本。 #### 3. GPU内存问题检查GPU内存是否足够。如果GPU内存不足，cuBLAS可能无法正常执行运算。可以通过任务管理器查看GPU的使用情况。如果是内存不足导致的问题，可以尝试减少批量大小或者关闭其他占用GPU资源的程序。 #### 4. CUDA驱动更新确保已经安装了最新的CUDA驱动程序。过时的驱动程序可能存在兼容性问题，通过官方NVIDIA网站下载并安装最新的驱动程序可能会解决该问题。 #### 5. 代码检查检查Caffe的配置文件和代码逻辑，确保不存在错误的参数设置或者数据处理问题。例如，检查输入数据的形状、维度是否符合模型要求。以下是一些示例代码用于查看GPU内存使用情况： ```python import torch # 如果使用PyTorch来查看GPU内存 if torch.cuda.is_available(): device = torch.device("cuda") print(f"Total GPU memory: {torch.cuda.get_device_properties(device).total_memory / (1024**3):.2f} GB") print(f"Allocated GPU memory: {torch.cuda.memory_allocated(device) / (1024**3):.2f} GB") print(f"Cached GPU memory: {torch.cuda.memory_reserved(device) / (1024**3):.2f} GB") ```