由于是在服务器上安装,所以下载软件有点不方便,其他的跟 ubuntu下Tensorflow的GPU配置:https://blog.youkuaiyun.com/carina_cao/article/details/78875981一样。踩过这么多坑,渐渐地竟然成安装高手了,哈哈!
tip:本文全部是在服务器的root用户下操作的,因为个人用户没有安装权限啊。
一 安装显卡驱动
# yum -y install gcc kernel-devel kernel-headers
# http://elrepo.org/tiki/tiki-index.php //添加第三方源ELRepo
# rpm --import https://www.elrepo.org/RPM-GPG-KEY-elrepo.org
# rpm -Uvh http://www.elrepo.org/elrepo-release-7.0-2.el7.elrepo.noarch.rpm
# yum install yum-plugin-fastestmirror
# vi /lib/modprobe.d/dist-blacklist.conf //屏蔽默认的nouveau,做以下操作,保存退出
#blacklist nvidiafb //注释这行
blacklist nouveau //添加这行
options nouveau modeset=0 //添加这行
# mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
# dracut /boot/initramfs-$(uname -r).img $(uname -r)
# reboot
# ls mod | grep nouveau //查看nouveau是否已经禁用,没有输出表示已经屏蔽
接下来开始安装显卡驱动
# yum install nvidia-detect //安装检查显卡程序
# nvidia-detect -v //输出下面这行,390.59就是需要安装的驱动版本
This device requires the current 390.59 NVIDIA driver kmod-nvidia
# yum -y install kmod-nvidia-390.59
# reboot
# nvidia-smi //检查是否安装好
二 安装cuda9.0
从cuda官网使用wget下载
# wget https://developer.nvidia.com/compute/cuda/9.0/Prod/local_installers/cuda_9.0.176_384.81_linux-run
# sh cuda_9.0.176_384.81_linux-run //这里是-run不是.run
安装过程参考 ubuntu下Tensorflow的GPU配置:https://blog.youkuaiyun.com/carina_cao/article/details/78875981
三 安装cudnn v7
去官网下载cudnn v7,使用scp命令从本机上传到服务器端(前提是支持ssh登录),因为cudnn官网需要登录,所以不能使用wget命令。
scp -P 55×× -r /home/caohz/cudnn-9.0-linux-x64-v7.tgz root@193.112.××.××:share
tip:share文件需要有写权限,登录服务器端用chmod 777 share
命令添加权限。
有关下载,解压,安装等步骤参考ubuntu下Tensorflow的GPU配置:https://blog.youkuaiyun.com/carina_cao/article/details/78875981
四 安装bazel
安装bazel有点麻烦,因为官网没有给出安装包。后来发现使用pip安装tensorflow不需要装bazel,所以可以跳过这步,使用源码安装的可以参考这步。
4.1 安装jdk1.8.0
必须是1.8以上版本才行,下载地址:http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html。进入下载界面,选择Accept Licence Agreement,点击jdk-8u171-linux-x86.tar.gz就可以直接下载了。
注意:不要使用wget命令下载,否则无法解压。因为wget命令默认没有选择Accept Licence Agreement。
使用下面的命令将下载的包从本机上传到服务器
scp -P 55×× /home/caohz/jdk-8u171-linux-x86.tar.gz root@193.112.××.××:share
有关scp命令详解及报错参考https://blog.youkuaiyun.com/carina_cao/article/details/80846598
# mv share/jdk-8u171-linux-x86.tar.gz ~
# tar zxvf jdk-8u171-linux-x86.tar.gz
# mkdir /usr/java
# mv ~/jdk1.8.0_171 /usr/java
# vi /etc/profile //添加下面代码,保存退出
export JAVA_HOME=/usr/java/jdk1.8.0_171
export JRE_HOME=${JAVA_HOME}/jre
export PATH=$PATH:${JAVA_HOME}/bin
export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib
# source /etc/profile
# yum install java-1.8.0-openjdk-devel.x86_64
安装jdk参考http://blog.sina.com.cn/s/blog_94c2c46a0102wysg.html
4.2 安装bazel 0.5.3
# yum install zip gcc-c++ unzip openssl openssl-devel //bazel依赖
# wget https://github.com/bazelbuild/bazel/releases/download/0.5.3/bazel-0.5.3-without-jdk-installer-linux-x86_64.sh //要试几次才能成功
# yum install unzip Java-1.8.0-openjdk java-1.8.0-openjdk-devel -y
# chmod +x bazel-0.5.3-without-jdk-installer-linux-x86_64.sh
# ./bazel-0.5.3-without-jdk-installer-linux-x86_64.sh --user
# bazel
安装bazel参考http://f.dataguru.cn/thread-857464-1-1.html
五 安装python3.6.4
# yum install openssl-devel bzip2-devel expat-devel gdbm-devel readline-devel sqlite-devel //安装python3.6可能使用的依赖
# wget https://www.python.org/ftp/python/3.6.4/Python-3.6.4.tgz
# tar -zxvf Python-3.6.4.tgz
# mv Python-3.6.4 /usr/local
# cd /usr/local/Python-3.6.4/
# ./configure
# make
# make install
# ll /usr/bin | grep python
# rm -rf /usr/bin/python
# ln -s /usr/local/bin/python3.6 /usr/bin/python
# python -V
修改了python的软链接会影响yum命令,报错File “/usr/bin/yum”, line 30 except KeyboardInterrupt 解决方法参考https://blog.youkuaiyun.com/carina_cao/article/details/80846251
六 安装tensorflow
将pip3链接过来就可以安装了,链接过程参考https://blog.youkuaiyun.com/carina_cao/article/details/80719942
# pip -V //查看pip版本和对应的python版本
# pip install --upgrade tensorflow-gpu //安装gpu的tensorflow
后期需要什么python包用pip装就可以了。