说明:关于显卡驱动的安装,主要有三步:1. gcc的安装,2. nouveau驱动的静止运行。3. 安装驱动
关于daocker环境的安装,主要有两步,1. 安装docker 2.安装nvidia-docker
慎重提示:本次演示是使用的centos7系统,有使用ubantu或其他系统的小伙伴,请酌情观看。
1. 显卡驱动的安装
1.1 gcc和g++的安装
先验证系统中是否安装了gcc和g++,如果没有安装可通过yum源进行安装,若服务器没有联网可通过本地安装,gcc和g++的安装包链接在此不用谢。提取码:3x0g
通过,gcc -v和g++ -v,查看系统的gcc和g++情况,如本系统如下所示:
联网的服务器,可直接使用yum安装,安装命令如下:
yum install gcc gcc-c++ tar make
没有联网的服务器,可使用本地方法安装,安装包解压后如下所示:
使用,如下命令进行安装
rpm -Uvh *.rpm --nodeps --force
安装进度如下所示:
安装成功过后,使用gcc -v和g++ -v可得到如下信息:
注意:若使用的是联网安装的gcc和g++包,要注意查看有没有安装kernel-header,使用本地的yum安装,(使用本地安装包的不同担心,安装包已经安装过了)
yum install kernel-devel-$(uname -r) kernel-headers-$(uname -r)
1.2 关于nouveau驱动的禁止
使用如下命令,查看nouveau驱动的情况,若没有输出则表示驱动没有启动,若有输出则需要静止,本次演示的结果如下:
lsmod | grep nouveau
若有输出,使用如下命令进行禁止
vim /usr/lib/modprobe.d/blacklist-nouveau.conf
# 加入的内容:
blacklist nouveau
options nouveau modeset=0
具体演示过程如下:
文件写入保存退出后,执行以下命令使命令生效:
dracut -f
systemctl set-default multi-user.target
# 执行完毕后重启服务器
reboot
再次查看Nouneau模块是否运行,如果没有输出则禁用成功。
lsmod | grep nouveau
1.3 显卡驱动的安装
使用如下命令,查看系统是否已经安装了显卡驱动
nvidia-smi
若显卡驱动已经有了,则在安装新驱动时需要卸载已有的驱动
/usr/bin/nvidia-uninstall
回到正题,使用如下命令查看自己的显卡信息。如本次演示的显卡信息如下:
lspci | grep -i nvidia
接下来就简单了,百度自己的显卡属于哪一种类型就ok了,这里我就不贴出百度的链接了。
去显卡驱动的官网下载驱动,官方显卡驱动链接地址在此
注意:选取自己适用的显卡和版本。
将显卡驱动下载下来并上传到服务器后,适用如下命令进行安装:
sudo chmod a+x 驱动文件名
sudo ./驱动文件名
注意:安装过程中可能会提示一些问题,选yes就行。
安装完成后输入,nvidia-smi得到显卡的显示结果,则表示安装成功,本次演示的结果如下:
2. Docker的安装
2.1 安装docker
使用如下命令,查看Linux的内核版本,docker要求CentOS系统的内核版本高于3.10才能使用dokcer
uname -r
使用如下命令,进行yum的更新,如果不行请切换只root权限。
yum update
查看当前系统是否有docker,如果有,则需要使用如下命令进行docker的卸载。
较旧的 Docker 版本称为 docker 或 docker-engine 。
yum remove docker \
docker-client \
docker-client-latest \
docker-common \
docker-latest \
docker-latest-logrotate \
docker-logrotate \
docker-selinux \
docker-engine-selinux \
docker-engine
新的 Docker 版本称为 docker-ce(社区版)。
yum remove docker-ce \
docker-ce-cli \
containerd
systemctl stop docker
rm -rf /etc/systemd/system/docker.service.d
rm -rf /etc/systemd/system/docker.service
rm -rf /var/lib/docker
rm -rf /var/run/docker
rm -rf /usr/local/docker
rm -rf /etc/docker
rm -rf /usr/bin/docker* /usr/bin/containerd* /usr/bin/runc /usr/bin/ctr
准备工作完成后,需要下载一些驱动,使用如下命令:
yum install -y yum-utils device-mapper-persistent-data lvm2
使用如下命令,更改yum的源,避免docker下载中断,当然你要是挂了vpn头铁当我没说。
yum-config-manager --add-repo https://download.docker.com/linux/centos/docker-ce.repo
使用如下命令,查看当前源仓库内所有的docker版本,然后选择需要的版本,建议装低一点的,别问,问就是被坑了。
yum list docker-ce --showduplicates | sort -r
使用如下命令进行安装,注意自己选取版本,使用docker-ce-(+版本号),如下所示
yum install docker-ce-18.03.1.ce
安装完成后,使用如下命令,设置docker开机自启动。
sudo systemctl start docker
sudo systemctl status docker
sudo systemctl enable docker
2.2 nvidia-docker的安装
注意:不安装这个的话,在服务器中是没法在docker中使用显卡的,当然你不需要的话就当我没说。
使用如下命令设置nvidia-docker的存储库和 GPG 密钥,记得切换到root哦
distribution=$(. /etc/os-release;echo $ID$VERSION_ID) \
&& curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.repo | tee /etc/yum.repos.d/nvidia-docker.repo
使用如下命令,更新部分安装包和依赖
yum clean expire-cache
使用如下命令安装nvidia-docker,不要问为什么安装的是nvidia-docker2而不是1,问就是被坑过。
yum install -y nvidia-docker2
到此处,环境就安装完全了,头铁不信的小伙伴可以自己上传一个镜像试试行不行。