ubuntu安装深度学习环境nvidia,nvidia-docker
安装NVIDIA
CUDA版本对照表(一般而言,不同版本的CUDA要求不同的NVIDIA驱动版本,同时显卡驱动版本要不低于CUDA的安装版本,具体的对照关系如下:):
登录官网,下载对应驱动安装包
https://www.nvidia.cn/Download/index.aspx?lang=cn
选择对应的版本并下载
安装nvidia驱动
-
图形界面可先关闭图形窗口
sudo service lightdm stop
-
执行对应版本的.run文件,我用的是纯命令行界面
chmod +x ./NVIDIA-Linux-x86_64-440.44.run
./NVIDIA-Linux-x86_64-440.44.run -no-x-check -no-nouveau-check -no-opengl-files
-no-x-check:安装驱动时关闭X服务 -no-nouveau-check:安装驱动时禁用nouveau -no-opengl-files:只安装驱动文件,不安装OpenGL文件
-
安装过程中一路选OK,遇错查错,更换版本会自动卸载旧版安装新版
-
测试安装是否成功
nvidia-smi
出现上个图即表示安装成功,我服务器端安装的是418版本。
安装nvidia-docker
Ubuntu 16.04/18.04, Debian Jessie/Stretch/Buster
# If you have nvidia-docker 1.0 installed: we need to remove it and all existing GPU containers
docker volume ls -q -f driver=nvidia-docker | xargs -r -I{} -n1 docker ps -q -a -f volume={} | xargs -r docker rm -f
sudo apt-get purge -y nvidia-docker
# Add the package repositories
curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | \
sudo apt-key add -
distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | \
sudo tee /etc/apt/sources.list.d/nvidia-docker.list
sudo apt-get update
# Install nvidia-docker2 and reload the Docker daemon configuration
sudo apt-get install -y nvidia-docker2
sudo pkill -SIGHUP dockerd
# Test nvidia-smi with the latest official CUDA image
docker run --runtime=nvidia --rm nvidia/cuda:9.0-base nvidia-smi
- 测试安装是否成功
nvidia-docker
docker run --runtime=nvidia --rm nvidia/cuda:9.0-base nvidia-smi
- 此时可拉取相关的tensorflow镜像进行使用
安装CUDA
如果遇见CUDA版本不满足的情况,可参考官网说明安装对应版本cuda。
cuda官网下载