NVIDIA Docker2安装教程及踩坑历险记
安装前准备
本地配置
服务器系统:Ubuntu 16.04.5 LTS (GNU/Linux 4.15.0-60-generic x86_64)
四个GPU 型号:NVIDIA TITAN Xp
Docker Version : 18.06.0-ce ,build e68fc7a
NVIDIA 驱动版本:418.56
CUDA 10.0
cuDnn 7.6.0
安装必备条件
GNU/Linux x86_64 with kernel version > 3.10
Docker >= 1.12
NVIDIA GPU with Architecture > Fermi (2.1)
NVIDIA drivers >= 361.93 (untested on older versions)
确保已为发行版安装了NVIDIA驱动程序和受支持的Docker 版本。
安装动机及原因
因实验室有计算机视觉及其他方向,并且运用tensorflow框架需要用到GPU进行模型训练,因GitHub各项目代码所实现的环境要求不同,服务器环境配置较为繁琐,于是自己钻研docker 技术,以便省去环境配置的麻烦。为了能够在docker容器内利用服务器的GPU资源,需要一个较高版本的NVIDIA显卡驱动+NVIDIA docker插件(已更新至NVIDIA docker2.0),假设在各位已经安装好docker的前提下进行如下步骤。
一点说明
因NVIDIA docker2.0版本在机制上较NVIDIA docker1.0版本有明显的改进,版本对比为了跟进发展的步伐,这里采用2.0版本。根据项目需求不同,要装1.0版本的童鞋可参照此文章进行安装,链接地址:NVIDIA docker1.0安装
安装nvidia-docker2
官网安装教程:
1、如果之前安装nvidia-docker 1.0版本,我们需要将其移除,并且移除所有存在的GPU容器:(逐行执行命令)
docker volume ls -q -f driver=nvidia-docker | xargs -r -I{
} -n1 docker ps -q -a -f volume={
} | xargs -r docker rm -f
sudo apt-get purge -y nvidia-docker
2、Add the package repositories:
curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add -
distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
接下来有许多教程采用如下命令
#curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list
我亲测,结果报错,提示类似distribution的错误,于是接下来采用以下命令
curl -s -L https://nvidia.github