NVIDIA驱动更新

部署运行你感兴趣的模型镜像

问题

某一天使用torch2.6.0+cu124发现无法使用gpu版本的pytorch,
此时输入nvidia-smi发现找不到gpu的驱动
NVIDIA-SMI has failed because it couldn’t communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

尝试和解决

1)先尝试从Software& Updates更新驱动,但没有效果
Using NVIDIA driver metapackage from nvidia-driver-570(proprietary)

2)尝试卸载驱动后用apt install安装,还是不行(未必真的不行,也有可能是因为此时还是远程安装没接显示器)
sudo apt purge nvidia # 彻底卸载现有驱动
sudo apt autoremove
sudo reboot # 重启
sudo apt install nvidia-driver-580

3)根据另外一个朋友成功用.run安装的尝试
////////卸载nvidia驱动
sudo apt purge nvidia cuda vdpau libnvidia
sudo apt autoremove --purge
sudo apt-get remove --purge nvidia-*

////在nvidia官网搜索对应的驱动程序NVIDIA-Linux-x86_64-570.181.run并下载在这里插入图片描述
////////关闭 nouveau(在安装run.sh里会有提示,最关键的是重启后会需要进入蓝白色界面加载驱动,所以这个时候不能使用.ssh的远程方式看,而是需要接着显示器去操作)
vim /etc/modprobe.d/blacklist.conf
blacklist nouveau
options nouveau modeset=0

update-initramfs -u
rmmod nouveau
lsmod | grep nouveau

./NVIDIA-xxxx.run
/usr/share/nvidia/nvidia-modsign-crt-E5277E61.der
E5:27:7E:61:EA:4B:7A:C9:93:73:2F:BD:26:D7:BC:B4:D3:D8:47:3F
/usr/share/doc/NVIDIA_GLX-1.0/README.txt
reboot
sudo mokutil --import /usr/share/nvidia/nvidia-modsign-crt-E5277E61.der
reboot
///////加载驱动
(1)当进入蓝色背景的界面perform mok management 后,选择 enroll mok ,
(2)进入enroll mok 界面,选择 continue ,
(3)进入enroll the key 界面,选择 yes,
(4)接下来输入你在安装驱动时输入的密码,
(5)之后会跳到蓝色背景的界面perform mok management选择第一个 reboot

成功安装后nvidia-smi正常了在这里插入图片描述

总结

显示驱动的安装有时还是需要接上显示器来看的,因为远程去看很可能就跳过了一些步骤,特别是重启进入类似bios的步骤。实际操作还是需要多折腾,大模型的回答或许可以参考但还不能适配各种实际情况。

您可能感兴趣的与本文相关的镜像

PyTorch 2.5

PyTorch 2.5

PyTorch
Cuda

PyTorch 是一个开源的 Python 机器学习库,基于 Torch 库,底层由 C++ 实现,应用于人工智能领域,如计算机视觉和自然语言处理

### NVIDIA显卡驱动更新与安装方法 NVIDIA显卡驱动更新和安装可以通过多种方式进行,以下是一些常见且有效的方法: #### 方法一:通过NVIDIA官网下载并安装驱动 用户可以直接访问NVIDIA官方网站以获取最新的驱动程序。在官网上选择对应的操作系统、显卡型号以及其他必要参数后,即可下载适用于系统的驱动文件。例如,下载名为`NVIDIA-Linux-x86_64-550.120.run`的文件,并按照官方指导完成安装[^1]。 #### 方法二:使用Geforce Experience自动更新驱动 对于Windows用户,Geforce Experience是一款非常便捷的工具。通过打开该应用程序并登录NVIDIA账号,可以进入“驱动程序”选项卡检查是否有可用的更新。如果存在新版本驱动(如从已安装的457.51版本更新到最新版本565.90),点击“立即更新”按钮即可开始下载和安装过程[^2]。 #### 方法三:Ubuntu系统中利用命令行工具安装推荐驱动Linux环境下,特别是基于Debian的发行版如Ubuntu,可以借助`ubuntu-drivers`命令来自动检测并安装最适合当前硬件环境的NVIDIA驱动。执行以下命令: ```bash sudo ubuntu-drivers autoinstall ``` 这条命令会查找并安装系统推荐的最佳驱动版本[^3]。 #### 方法四:手动添加PPA源并安装特定版本驱动 针对需要更精确控制驱动版本的情况,比如在Ubuntu 16.04上操作时,可以先添加图形驱动器PPA仓库: ```bash sudo add-apt-repository ppa:graphics-drivers/ppa sudo apt-get update ``` 之后,在软件和更新设置中的附加驱动部分可查看可供选择的具体驱动版本列表[^5]。 #### 方法五:通过命令行监控驱动状态及验证安装 无论采用哪种方式完成驱动安装或升级,都可以通过运行`nvidia-smi`命令来确认驱动是否正确加载以及了解有关GPU的详细信息。 #### 注意事项 - 在尝试任何新的驱动版本前,请确保备份重要数据。 - 如果新版本驱动出现问题,NVIDIA提供了一定程度上的系统恢复功能,允许用户退回至之前正常工作的状态[^4]。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值