前言
一顿操作猛如虎,一看训练
第一次试装的是cuda11.1和cudnn11.1,但是运行tf2.5时有两个库打不开,这两个库是有的但是,没能识别出来就不知道为什么。
我想安装cuda11.0的,但是系统不给我装
中间略过一顿sao操作后
nvidia驱动
驱动版本为460.32.03
安装cuda11.1
sudo sh cuda_11.1.0_455.23.05_linux.run
可以不装driver和sample
添加环境变量
vi ~/.bashrc
在文件末尾添加
export PATH="/usr/local/cuda-10.1/bin:$PATH" #按照实际的cuda文件名字来
export LD_LIBRARY_PATH="/usr/lcoal/cuda-10.1/lib64:$LD_LIBRARY_PATH"
最后使其生效
source ~/.bashrc
CUDNN11.2
我运行tf的时候用cudnn11.1会报错,11.2不会,就离谱
sudo cp cuda/include/cudnn.h /usr/local/cuda/include/
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/
sudo chmod a+r /usr/local/cuda/include/cudnn.h
anaconda和pycharm安装略过
tensorflow2.5.0(好像是测试版本)
pip install tf-nightly-gpu -i http://pypi.douban.com/simple --trusted-host pypi.douban.com
神来之笔
其实到这里还是失败的,于是我想卸载手动安装的nvidia驱动
sudo apt autoremove nvidia*
运行这行命令后会卸载很多nvidia的东西,然后重启发现驱动还没卸载,再试下代码,成功识别到库了,但是不能识别cudnn,红字提示要cudnn8.1.0,我就用cudnn11.2代替了cudnn11.1,就成功了,离谱,我至今都不知道怎么装。下次安装再验证吧,太邪门了。
测试速度
起飞