问题表现:训练网络时提示下错误
Check failed: status == CUDNN_STATUS_SUCCESS (3 vs. 0) CUDNN_STATUS_BAD_PARAM
系统环境:
- Ubuntu 14.04
- GeForce GTX TITAN X 驱动 384.90
- CUDA 8.0
- cudnn 6.0.21
由于运行 Tensorflow 1.4.0 版本时提示 libcudnn.6.so 找不到文件,因此将cudnn版本升级至6.0版本,使用 cudnn-8.0-linux-x64-v6.0.tar 解压安装,升级完成后,tensoflow执行正常,但caffe则提示 错误 CUDNN_STATUS_BAD_PARAM
问题解决:
重新安装cudnn 5.1版本,使用 cudnn-8.0-linux-x64-v5.1.tgz 解压安装,覆盖 /usr/local/cuda/lib64/ 下面的 libcudnn.so 软链接文件,但 cudnn 6.0 的库文件仍然存在
sudo tar -xzf cudnn-8.0-linux-x64-v5.1.tgz -C /usr/local</

在Ubuntu 14.04上,使用GeForce GTX TITAN X,CUDA 8.0和cuDNN 6.0.21时,训练Caffe网络遇到CUDNN_STATUS_BAD_PARAM错误。为解决TensorFlow 1.4.0的libcudnn.6.so缺失问题,升级到cuDNN 6.0导致该错误。最终通过回退到cuDNN 5.1版本并覆盖lib64下的软链接文件修复了问题,同时确保TensorFlow和Caffe都能正常运行。其他可能的原因包括GPU被其他进程占用、网络配置问题或显存不足。
最低0.47元/天 解锁文章
5156

被折叠的 条评论
为什么被折叠?



