参考资料:https://blog.youkuaiyun.com/cy309173854/article/details/95618717
https://www.cnblogs.com/gollong/p/12655424.html
安装lspci:yum install pciutils
查看机器显卡:
lspci | grep -i vga
lspci | grep NVIDIA
禁用显卡
sudo rmmod nouveau
lsmod | grep nouveau
查找英伟达显卡驱动
https://www.nvidia.com/Download/index.aspx?lang=cn
https://blog.youkuaiyun.com/cy309173854/article/details/95618717
2.2 安装nvidia driver
STEP1 查看之前是否安装过nvidia driver:nvidia-smi,如果没有显示相关信息表明未安装。
STEP2 下载 nvidia driver:https://www.geforce.cn/drivers
选择对应显卡,从而找到对应的驱动。
STEP3 给驱动文件赋权限
# chmod +x NVIDIA-Linux-x86_64-430.26.run
STEP4 命令行安装驱动
# ./NVIDIA-Linux-x86_64-430.26.run -no-x-check -no-nouveau-check -no-opengl-files
其中:-no-x-check:安装驱动时关闭X服务```
-no-nouveau-check 安装驱动时禁止nouveau
-no-opengl-files只安装驱动文件,不安装OpenGL文件
STEP5 检查是否安装成功,运行 nvidia-smi,如出现下图表明安装成功
https://www.cnblogs.com/gollong/p/12655424.html
1.出现错误:
解决办法:yum install gcc
2.出现错误:
解决办法:yum install kernel-devel gcc -y
2.检查内核版本和源码版本,保证一致
ls /boot | grep vmlinu rpm -aq | grep kernel-deve
./NVIDIA-Linux-x86_64-418.152.00.run --kernel-source-path=/usr/src/kernels/3.10.0-1127.19.1.el7.x86_64 -k $(uname -r)
centos 7 安装 nvidia驱动时遇到的ERROR: Unable to load the 'nvidia-drm' kernel module问题,网上查询大部份查询都是说出现这个问题最有可能的原因是你安装的Ubuntu是UEFI模式启动的,但是在BIOS中却打开了Security BOOT选项。 正确做法是禁用该选项。我的是禁用的。
解决办法:核版本不一致导致的失败
# uname -r
# ll /usr/src/kernels/
查询的结果不一致,解决办法,升级内核
#yum -y update
切记:升级完内核,需要重启!!!!
reboot
rpm -qa | grep kernel
uname -r
1、卸载显卡驱动的命令:
假如安装的是NVDIA-Linux-x86-340.96.run
则运行如下命令:sh NVIDIA-Linux-x86-270.41.19.run --uninstall
cuda版本下载
https://developer.nvidia.com/cuda-toolkit-archive
https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html
chmod +x cuda_10.0.130_410.48_linux.run
https://www.jianshu.com/p/375245691cf2
https://www.jianshu.com/p/605b35e8b1a9
https://zhuanlan.zhihu.com/p/46717446
然后配置环境变量
vim ~/.bashrc
在末尾添加如下内容
export PATH=/usr/local/cuda-10.0/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-10.0/lib64:$LD_LIBRARY_PATH
执行如下命令
source ~/.bashrc
cat /usr/local/cuda/version.txt
yum install dkms
yum install epel-release
nvidia-smi报错 NVIDIA-SMI has failed because it couldn’t communicate with the NVIDIA driver. Make sure
解决办法:重新装驱动
卸载驱动:
1、卸载显卡驱动的命令:
假如安装的是NVDIA-Linux-x86-340.96.run
则运行如下命令:sh NVIDIA-Linux-x86-270.41.19.run --uninstall
2、卸载cuda-toolkit
#cd /usr/local/cuda-8.0/bin/
# ./uninstall_***
https://zhuanlan.zhihu.com/p/89714824
cudnn下载:
https://developer.nvidia.com/rdp/cudnn-archive
https://blog.youkuaiyun.com/XiaoMeow/article/details/94762483
cp cudnn-8.0-linux-x64-v5.1.solitairetheme8 cudnn-8.0-linux-x64-v5.1.tgz $ tar -xvf cudnn-8.0-linux-x64-v5.1.tgz
tar -xvf cudnn-8.0-linux-x64-v5.1.tgz
cp cuda/include/cudnn.h /usr/local/cuda/include
cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
1、查看cudnn版本号
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
2、查看cuda版本号
nvcc -V
或者
cat /usr/local/cuda/version.txt
3、查看显卡型号
lspci | grep -i nvidia
4、查看显卡驱动版本号
sudo dpkg --list | grep nvidia-*
或者
cat /proc/driver/nvidia/version