问题:服务器重启之后nvidia-smi无法使用,GPU也无法使用
具体报错信息如下:
Impossible to initialize nvidia nvml : Driver Not Loaded
问题出在cuda驱动在重启之后可能进行了更新,导致无法匹配
首先先把重启更新驱动这个设定关闭:
-
sudo vim /etc/apt/apt.conf.d/50unattended-upgrades -
把这两行注释掉

-
sudo reboot重启一下试试,如果重启后可以正常用了那可太好了
否则就只能重新安装驱动了(sad555)
-
首先先卸载之前nvidia相关的驱动
sudo apt-get purge nvidia* sudo apt-get autoremove -
添加nvidia源
sudo add-apt-repository ppa:graphics-drivers/ppa -
直接用推荐驱动版本安装
sudo ubuntu-drivers autoinstall -
最后再重启一次就可以了
除此之外还有些信息你可能用得上:
- 查看本地已安装显卡驱动:
dpkg -l | grep nvidia - 查看本地使用的具体显卡驱动版本信息:
cat /proc/driver/nvidia/version
本文介绍了在Ubuntu服务器重启后遇到NVIDIA-smi无法使用及GPU不可用的问题,问题根源可能是CUDA驱动更新导致不匹配。解决方法包括禁用自动更新驱动,重新安装驱动等步骤。首先通过编辑apt配置文件禁用驱动更新,然后卸载旧驱动,添加NVIDIA官方源并安装推荐驱动,最后重启系统。此外,还提供了检查已安装驱动和当前驱动版本的命令。
7703

被折叠的 条评论
为什么被折叠?



