NVIDIA-SMI has failed because it couldn’t communicate with the NVIDIA driver. Make sure that the lat

本文介绍了解决Ubuntu系统中NVIDIA GPU驱动与高内核版本不兼容的问题,提供了两种解决方案:一是通过选择合适的内核版本启动,二是重新安装特定版本的NVIDIA驱动以确保其与当前内核兼容。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

NVIDIA-SMI has failed because it couldn’t communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.


)

问题分析:

NVIDIA驱动是在低版本的时候安装,由于系统更新,内核版本升级导致NVIDIA无法应用在高内核版本,导致gpu不能使用

解决办法一:

在ubuntu(需要在机器的旁边,并且有显示器界面操作) 启动过程中的有3个选项:
1.Ubuntu
2.Advanced options for Ubuntu
3.system setup
选择Advanced options for Ubuntu,然后回进入子菜单选择启动的内核版本,uname -r 查看当前启动的内核版本为 4.15.0-36-generic,此时NVIDIA驱动运行完好

查看机器已有内核版本

输入命令:grep menuentry /boot/grub/grub.cfg 显示内核的顺序
或者在文件夹/usr/src中查看

解决办法二:

1 首先查看自己安装的nvidia版本,我的是430.50

ls /usr/src | grep nvidia

2 然后在命令行执行:

sudo apt install dkms
sudo dkms install -m nvidia -v 430.50

3 再次输入nvidia-smi就可以了

备注:推荐方法二
### 解决 `nvidia-smi` 无法与 NVIDIA 驱动程序通信的问题 当遇到 `nvidia-smi` 报错提示 “NVIDIA-SMI has failed because it couldn’t communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running”,这通常意味着系统未能成功加载或识别已安装的 NVIDIA 显卡驱动。 #### 可能的原因分析 1. **内核模块未正确加载** 如果在启动过程中,NVIDIA 的内核模块 (如 `nvidia`, `nvidia_uvm`) 没有被正确加载,则会导致此错误。可以通过命令 `lsmod | grep nvidia` 来确认这些模块是否存在并已被加载[^2]。 2. **第三方图形界面干扰** 安装其他显示管理器(例如通过尝试安装 LightDM),可能会引入冲突,影响到现有的 GPU 设备配置和工作状态[^3]。 3. **不兼容的操作系统更新** 当操作系统进行了某些安全补丁或其他类型的升级之后,可能会影响到之前版本的硬件支持情况,特别是对于专有的闭源驱动而言更为明显[^4]。 #### 推荐解决方案 为了修复上述提到的问题,可以按照如下方法操作: - **卸载现有驱动** 清理旧版驱动残留文件有助于避免潜在冲突: ```bash sudo apt-get purge nvidia* ``` - **重新编译 DKMS 模块** 若使用的是基于 Linux 内核动态加载机制(DKMS)构建的服务端环境,建议先移除再重建相关组件: ```bash sudo dkms remove nvidia/<version> --all sudo dpkg-reconfigure linux-headers-$(uname -r) sudo dkms add ./<path_to_nvidia_driver> sudo dkms build nvidia/<version> sudo dkms install nvidia/<version> ``` - **禁用 Secure Boot 功能** 对于启用了 UEFI 安全引导模式的工作站来说,默认设置下会阻止未经认证的二进制代码执行,因此需要进入 BIOS 设置页面关闭该选项以便顺利完成驱动部署过程[^1]. - **验证新驱动是否正常运作** 在完成以上步骤后重启计算机,并运行下面这条指令来测试新的驱动是否能够正常使用 ```bash nvidia-smi ``` 如果一切顺利的话应该可以看到有关显存占用率等信息而不是之前的报错了。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值