该文档仅作个人记录,使用该方法安装可以避免按照官方方法安装好后nvidia-smi无法识别到显卡。
第一步 安装驱动
参考文献:
ubuntu 自动安装nvidia显卡驱动https://blog.youkuaiyun.com/wuqingshan2010/article/details/109409544
1. 禁用nouveau
sudo vim /etc/modprobe.d/blacklist-nouveau.conf
# 在文件最后加入以下内容
blacklist nouveau
options nouveau modeset=0
# 编辑完后保存退出
sudo update-initramfs -u
sudo reboot
2. 安装驱动
sudo apt-get remove --purge nvidia*
ubuntu-drivers devices
sudo ubuntu-drivers autoinstall
第二步 安装cuda
参考文献:
CUDA Toolkit Downloads | NVIDIA Developerhttps://developer.nvidia.com/cuda-downloads
1. 安装
以Ubuntu 22.04为例
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-keyring_1.1-1_all.deb
sudo dpkg -i cuda-keyring_1.1-1_all.deb
sudo apt update
sudo apt -y install cuda-toolkit
2. 配置环境变量
sudo vim /etc/profile.d/cuda.sh
# 文件内容如下
export PATH=/usr/local/cuda/bin:$PATH
# 保存并退出
# 加载该文件
source /etc/profile.d/cuda.sh
附注
直接使用
sudo apt install cuda
安装的驱动经常出现nvidia-smi不认的情况,所以需要使用ubuntu自带的ubuntu-drivers安装驱动
根据英伟达的文档,CUDA包分为以下类型
cuda | 全套的CUDA工具链,包含显卡驱动和以下所有内容 |
cuda-12 | 限定大版本号为12的CUDA,不会跨大版本更新(下面的包同样可以加后缀实现不跨大版本更新) |
cuda-12-6 | 限定版本号为12.6的CUDA,不会跨小版本更新(下面的包同样可以加后缀实现不跨小版本更新) |
cuda-toolkit | 包含除驱动以外的全套工具链 |
cuda-tools | 包含CUDA的命令行和可视化工具 |
cuda-runtime | 包含显卡驱动和其他CUDA运行时库 |
cuda-compiler | 包含所有CUDA编译器 |
cuda-libraries | 包含所有CUDA运行时库 |
cuda-libraries-dev | 包含所有CUDA开发库 |