首先,nvidia driver和cuda的关系如下图
Table 1. CUDA Toolkit and Compatible Driver Versions
CUDA Toolkit Linux x86_64 Driver Version Windows x86_64 Driver Version
CUDA 10.0.130 >= 410.48 >= 411.31
CUDA 9.2 (9.2.148 Update 1) >= 396.37 >= 398.26
CUDA 9.2 (9.2.88) >= 396.26 >= 397.44
CUDA 9.1 (9.1.85) >= 390.46 >= 391.29
CUDA 9.0 (9.0.76) >= 384.81 >= 385.54
CUDA 8.0 (8.0.61 GA2) >= 375.26 >= 376.51
CUDA 8.0 (8.0.44) >= 367.48 >= 369.30
CUDA 7.5 (7.5.16) >= 352.31 >= 353.66
CUDA 7.0 (7.0.28) >= 346.46 >= 347.62
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt-get update
sudo apt-get install nvidia-384 #此处要根据上面查询到的版本适当更改
sudo apt-get install mesa-common-dev
在终端输入reboot
重启之后重新打开终端,输入nvidia-smi
可以得到下图
安装cuda
安装cuda tookit9.0版本,下载base_installer,按照说明安装,
然后配置cuda的环境
sudo gedit /etc/profile
打开文件后在文件末尾添加路径,也就是安装目录,命令如下:
export PATH=/usr/local/cuda-9.0/bin:
P
A
T
H
e
x
p
o
r
t
L
D
L
I
B
R
A
R
Y
P
A
T
H
=
/
u
s
r
/
l
o
c
a
l
/
c
u
d
a
−
9.0
/
l
i
b
64
PATH export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64
PATHexportLDLIBRARYPATH=/usr/local/cuda−9.0/lib64LD_LIBRARY_PATH
然后source /etc/profile
然后重启 reboot
重启之后输入nvcc -V
如果没有安装成功,按照提示继续安装,然后reboot,重启之后
再输入nvcc -V,会出现你安装的时间和版本号。
安装cudnn
从官网安装对应cuda 9.0的cudnn 模块,解压,然后
cd cuda
sudo cp lib64/lib* /usr/local/cuda/lib64/
sudo cp include/cudnn.h /usr/local/cuda/include/
cd /usr/local/cuda/lib64/
sudo chmod +r libcudnn.so.7.0.3 # 自己查看.so的版本
sudo ln -sf libcudnn.so.7.0.3. libcudnn.so.7
sudo ln -sf libcudnn.so.7 libcudnn.so
sudo ldconfig
见截图
然后重启,
最后 安装tensorflow1.9和tensorflow-gpu1.9
验证:
import tensorflow
import tensorflow as tf
hello = tf.constant(‘Hello, TensorFlow!’)
sess = tf.Session()
print(sess.run(hello))
结果如下:
可以看到已经打印出GPU的初始化信息啦。
另外,如果你刚开始nvidia driver 版本弄错啦,想卸载重装,
执行:
sudo /usr/local/cuda-8.0/bin/uninstall_cuda_8.0.pl
sudo /usr/bin/nvidia-uninstall
然后重启
reboot
就可以重新安装
参考文献:
原文:https://blog.youkuaiyun.com/ghw15221836342/article/details/79571559
https://blog.youkuaiyun.com/fdqw_sph/article/details/78745375