近些年,人工智能的发展迅速,相应的机器学习软件包也得到了很广泛的应用,但是由于发展太快,与Android旗下APP编写软件类似(Android Studio),存在很多问题,尤其是linux下。本文旨在说明安装tensorflow的gpu版本,亲测有效。
目录
1.确定tensorflow与CUDA版本的对应关系
首先要确定tensorflow与cuda的对应关系,网友提供了下面的对应关系
来自官网:https://tensorflow.google.cn/install/source.
2、确定GPU显卡驱动、cuda之间的对应关系
确定了要安装的tensorflow版本以及cuda版本后,需要进一步确定GPU显卡驱动、cuda之间的对应关系,可以去官网查看相应的网卡对应的驱动,下载下来:
NVIDIA官网链接:https://developer.nvidia.com/rdp/cudnn-archive#a-collapse742-10

3、GPU显卡驱动安装
3.1关闭图形界面
systemctl set-default multi-user.target
3.2首先禁用nouveau开源驱动
修改/etc/modprobe.d/blacklist.conf 文件:
如果存在blacklist.conf,添加blacklist nouveau,注释掉blacklist nvidiafb;
如果不存在,执行:
echo -e "blacklist nouveau\noptions nouveau modeset=0" > /etc/modprobe.d/blacklist.conf
3.3重建initramfs image
cp /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
dracut /boot/initramfs-$(uname -r).img $(uname -r)
# 这一步可不执行
rm /boot/initramfs-$(uname -r).img.bak ;
3.4重新启动
# 改为终端模式,runlevel改为3
systemctl set-default multi-user.target
init 3
# 重启服务器
reboot
# sudo shutdown -r now
# 重启后验证驱动是否被禁用 如果无结果显示则表明成功禁用
lsmod | grep nouveau
3.5查看系统内核版本
# 不同操作系统的内核版本会不一样
uname -r
# 3.10.0-957.el7.x86_64
# 确认boot目录的空间不少于300MB
df
3.6安装CUDA驱动
下载相应的驱动run文件,进行安装,命令如下
# 必需指定kernel source path,否则会报错;kernel的版本和系统内核有关,可能会有差别
./NVIDIA-Linux-x86_64-418.87.00.run --kernel-source-path=/usr/src/kernels/3.10.0-957.el7.x86_64 -k $(uname -r)
3.7检查驱动安装是否成功
# 查看GPU相关配置
nvidia-smi
# 如果正常显示安装的显卡信息,则说明驱动安装成功;
# 如果提示找不到该指令,或什么信息都没有显示,则驱动安装失败,可以卸载驱动后重新安装
3.8安装CUDA
下载相对应版本的cuda版本,进行安装,主页上有相应的命令。
3.9安装CUDNN
下载cuda版本对应的cudnn压缩包https://developer.nvidia.com/cudnn
解压cudnn并安装
$ sudo cp cuda/include/cudnn.h /usr/local/cuda/include/
$ sudo cp -a cuda/lib64/libcudnn* /usr/local/cuda/lib64/
$ sudo chmod a+r /usr/local/cuda/include/cudnn.h
$ sudo chmod a+r /usr/local/cuda/lib64/libcudnn*
3.10打开图形界面
systemctl set-default graphical.target
4、安装Anaconda
下载Anaconda:https://www.anaconda.com/download/#linux
安装Anaconda:
$ sudo bash Anaconda3-4.2.0-Linux-x86_64.sh
添加环境变量:
$ gedit ./.bashrc
查看版本检验是否安装完成:
conda --version
python --version
pip --version
5、安装Tensorflow
在Anaconda创建python环境:
$ conda create -n py35 python=3.5
激活环境:
$ source activate py35
选择tensorflow版本,最好使用国内镜像下载安装
(py35) $ pip install \ -i https://pypi.tuna.tsinghua.edu.cn/simple/ \ [https://mirrors.tuna.tsinghua.edu.cn/tensorflow/linux/gpu/tensorflow_gpu-1.3.0-cp35-cp35m-linux_x86_64.whl](https://mirrors.tuna.tsinghua.edu.cn/tensorflow/linux/gpu/tensorflow_gpu-1.3.0-cp35-cp35m-linux_x86_64.whl)
检验是否安装成功:
(py35) $ python
>>> import tensorflow
#退出环境:
>>> quit()
$ source deactivate py35
安装keras,sklearn等库
$ source activate py35
(py35) $ pip install keras -U --pre
(py35) $ pip install sklearn
剩下的就是安装一些编译器,像Pycharm,Spyder等,这些容易安装,可以查看相应的资料。
参考资料:
https://www.cnblogs.com/harrymore/p/10307769.html
https://www.jianshu.com/p/c600a89da5da
https://www.cnblogs.com/YSPXIZHEN/p/11466145.html
https://www.jianshu.com/p/98028ef0c52e?from=singlemessage
https://blog.youkuaiyun.com/caicaiatnbu/article/details/87626491
https://blog.youkuaiyun.com/u012485366/article/details/89981114