GPU服务器安装NVIDIA驱动和CUDA(解决无法驱动无法安装问题)

一、安装驱动之前需要禁用 nouveau 驱动

sudo vim /etc/modprobe.d/blacklist-nouveau.conf

在文件中加入以下内容

blacklist nouveau

options nouveau modeset=0

更新使其生效

sudo update-initramfs -u

重启机器

reboot

重启后查看是否禁用成功

lsmod | grep nouveau

输入命令后,没有内容输出,说明禁用成功

sudo apt-get update

sudo apt-get install gcc

sudo apt-get install cmake

gcc --version

cmake --versions

二、安装NVIDIA驱动

使用nvidia-smi检测是否安装驱动

nvidia-smi

ubuntu-drivers devices

推荐安装nvidia-driver-535

sudo apt install nvidia-driver-535

apt install mesa-utils

glxinfo | grep rendering

如果结果是yes,说明显卡驱动已经成功安装。

nvidia-smi,查看显卡驱动版本

显示的NVIDIA显卡驱动版本为535.171.04,本机最高支持CUDA 12.2

三、安装CUDA

验证是否安装CUDA,输入nvcc -V,发现未安装,使用apt install nvidia-cuda-toolkit安装的版本版本号会比较低,所以去官网找安装资源

NVIDIA官网查看CUDA版本CUDA 12.6 Update 3 Release Notes

NVIDIA官网下载CUDA

CUDA官网链接CUDA Toolkit Archive | NVIDIA Developer,找到CUDA Toolkit 12.2.0

选择系统版本对应的CUDA进行安装

官网链接为CUDA Toolkit 12.2 Downloads | NVIDIA Developer

wget https://developer.download.nvidia.com/compute/cuda/12.2.0/local_installers/cuda_12.2.0_535.54.03_linux.run

sudo sh cuda_12.2.0_535.54.03_linux.run

键盘“↓”,选择“Continue”

键盘输入“accept”

键盘点击“Enter”,取消“[X]Driver”中的X,变为“[ ]Driver”

注意:直接安装CUDA,未安装驱动的情况下,请不要取消“[X]Driver”中的X

点击“Install”

sudo gedit ~/.bashrc

将下列内容放在文档末尾

export PATH=$PATH:/usr/local/cuda-12.2/bin

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-12.2/lib64

export LIBRARY_PATH=$LIBRARY_PATH:/usr/local/cuda-12.2/lib64

重启

reboot

验证CUDA是否安装成功

nvcc -V

四、reboot开启GPU的持久模式

sudo nvidia-smi -pm 1

nvidia-smi

附:无法安装驱动的解决方案

方案一:直接安装CUDA时选择安装驱动

方案二:检查操作系统是否与apt镜像源相匹配

Ubuntu22.04系统可以参考我的更新apt镜像源的步骤

Ubuntu22.04系统apt镜像源报错解决思路_ubuntuserver24.04.1离线安装界面设置镜像源后报错-优快云博客 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值