1.查看安装环境
命令代码:
# cat /proc/version
# rpm -qa | grep kernel
# lsmod | grep nouveau
2.安装NVIDIA驱动
2.1禁用nouveau
用lsmod命令进行查看,出现以上nouveau信息表明nouveau没有禁用
禁用方法1:
使用lsmod命令进行查看,没有nouveau信息表明禁用成功
禁用方法2:
如果禁用方法1没有成功,则可采取方法2进行禁用
添加两行内容:
命令代码:
# lsmod | grep nouveau
# echo -e "blacklist nouveau\noptions nouveau modeset=0" > /etc/modprobe.d/blacklist.conf
# shutdown -r now
# lsmod | grep nouveau
# vi /usr/lib/modprobe.d/dist-blacklist.conf
blacklist nouveau
options nouveau modeset=0
2.2建立镜像文件
下一步给当前镜像备份&&建立新的镜像
命令代码:
# mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
# dracut /boot/initramfs-$(uname -r).img $(uname -r)
2.3安装驱动
2.3.1下载
到英伟达官网(https://www.nvidia.cn/Download/index.aspx?lang=cn)选择显卡和系统版本进行驱动下载
点击搜索,下一步点击download,右键agree&download,复制链接地址执行以下命令开始下载驱动
# wget http://us.download.nvidia.com/tesla/418.67/NVIDIA-Linux-x86_64-418.67.run
2.3.2执行安装
执行以下命令切换到运行级别3,开始安装
命令代码:
# init 3
# chmod +x NVIDIA-Linux-x86_64-384.59.run
# sudo ./NVIDIA-Linux-x86_64-418.67.run -no-x-check -no-nouveau-check -no-opengl-files
安装过程出现的错误
错误1:
错误2:
yes或no选择错误
3.安装CUDA
3.1安装cuda
在官网进行下载:https://developer.nvidia.com/cuda-toolkit-archive
命令代码:
# wget http://developer.download.nvidia.com/compute/cuda/10.2/Prod/local_installers/cuda-repo-rhel7-10-2-local-10.2.89-440.33.01-1.0-1.x86_64.rpm
# sudo rpm -i cuda-repo-rhel7-10-2-local-10.2.89-440.33.01-1.0-1.x86_64.rpm
# sudo yum clean allsudo yum -y install nvidia-driver-latest-dkms cuda
# sudo yum -y install cuda-drivers
安装过程出现的错误
错误1:缺少dkms,安装epel仓库
Nvidia 驱动RPM包依赖于其他软件包,例如DKMS和libvdpau,这些包仅在第三方源是可用的(如EPEL),因此在安装Nvidia驱动之前需要添加第三方源到软件包管理库中,否则会影响安装过程。
115行代码会在/var中生成相应的cuda rpm包
可参考:https://blog.youkuaiyun.com/happyfreeangel/article/details/86529165
命令代码:
# wget http://dl.fedoraproject.org/pub/epel/epel-release-latest-7.noarch.rpm
# rpm -ivh epel-release-latest-7.noarch.rpm
# yum repolist
# yum --enablerepo=epel install ****
# sudo rpm -i cuda-repo-rhel7-10-2-local-10.2.89-440.33.01-1.0-1.x86_64.rpm
# sudo yum clean all
# yum clean expire-cache
# yum install cuda
错误2:缺少dkms,下载dkms
错误3:缺少dkms,在开始安装cuda前就安装epel或ELRepo仓库
两个源安装其中一个即可
安装epel仓库:
# yum install epel-*
# yum install dkms -y
# yum install nvidia* -y
安装ELRepo仓库
yum install https://www.elrepo.org/elrepo-release-7.el7.elrepo.noarch.rpm
ELRepo官网:http://elrepo.org/tiki/tiki-index.php
3.2配置环境变量并验证
在/etc/profile中添加环境变量:
命令代码:
# vim /etc/profile
export PATH=/usr/local/cuda-10.2/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-10.2/lib64:$LD_LIBRARY_PATH
# source /etc/profile
# which nvcc
# cd /usr/local/cuda/samples/1_Utilities/deviceQuery
# make
# ./deviceQuery