Ubuntu 16.04 显卡报错NVIDIA-SMI has failed because it couldn‘t communicatewith the NVIDIA driver.....

本文解决了一个在Ubuntu16.04.7 LTS服务器上使用nvidia-smi时遇到的问题,显卡出现通信错误。通过检查nvidia版本、安装dkms并重新安装指定版本的nvidia驱动程序来解决问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

环境:

Ubuntu 16.04.7 LTS
4.15.0-142-generic

问题描述:

服务器使用nvidia-smi突然显卡报错:

nvidia-smi

NVIDIA-SMI has failed because it couldn’t communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

解决方案:

1.查看服务器nvidia版本

ls /usr/src | grep nvidia

nvidia-455.23.05

2.执行apt install dkms

apt install dkms
Reading package lists... Done
Building dependency tree
Reading state information... Done
dkms is already the newest version (2.2.0.3-2ubuntu11.8).
0 upgraded, 0 newly installed, 0 to remove and 62 not upgraded.

3.执行dkms install -m nvidia -v 455.23.05(你的显卡版本号)

dkms install -m nvidia -v 455.23.05

Creating symlink /var/lib/dkms/nvidia/455.23.05/source ->
                 /usr/src/nvidia-455.23.05

DKMS: add completed.

Kernel preparation unnecessary for this kernel.  Skipping...

Building module:
cleaning build area....
'make' -j32 NV_EXCLUDE_BUILD_MODULES='' KERNEL_UNAME=4.15.0-142-generic IGNORE_CC_MISMATCH='1' modules........
cleaning build area....

DKMS: build completed.

nvidia.ko:
Running module version sanity check.
 - Original module
   - No original module exists within this kernel
 - Installation
   - Installing to /lib/modules/4.15.0-142-generic/updates/dkms/

nvidia-uvm.ko:
Running module version sanity check.
 - Original module
   - No original module exists within this kernel
 - Installation
   - Installing to /lib/modules/4.15.0-142-generic/updates/dkms/

nvidia-modeset.ko:
Running module version sanity check.
 - Original module
   - No original module exists within this kernel
 - Installation
   - Installing to /lib/modules/4.15.0-142-generic/updates/dkms/

nvidia-drm.ko:
Running module version sanity check.
 - Original module
   - No original module exists within this kernel
 - Installation
   - Installing to /lib/modules/4.15.0-142-generic/updates/dkms/

depmod....

DKMS: install completed.

4.再次执行nvidia-smi,看看是否正常

nvidia-smi
Fri Mar 25 09:03:41 2022
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 455.23.05    Driver Version: 455.23.05    CUDA Version: 11.1     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  GeForce GTX 108...  Off  | 00000000:08:00.0 Off |                  N/A |
| 24%   32C    P0    59W / 250W |      0MiB / 11178MiB |      0%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+
|   1  GeForce GTX 108...  Off  | 00000000:09:00.0 Off |                  N/A |
| 21%   37C    P0    59W / 250W |      0MiB / 11178MiB |      0%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+
|   2  GeForce GTX 108...  Off  | 00000000:88:00.0 Off |                  N/A |
| 15%   30C    P0    57W / 250W |      0MiB / 11178MiB |      0%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+
|   3  GeForce GTX 108...  Off  | 00000000:89:00.0 Off |                  N/A |
| 12%   29C    P0    53W / 250W |      0MiB / 11178MiB |      2%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Processes:                                                                  |
|  GPU   GI   CI        PID   Type   Process name                  GPU Memory |
|        ID   ID                                                   Usage      |
|=============================================================================|
|  No running processes found                                                 |
+-----------------------------------------------------------------------------+
<think>好的,用户现在的问题是询问如何重启nvidia-smi工具来解决NVIDIA X Screen 1未显示的问题。首先,我需要理解用户的需求和背景情况。用户之前遇到了与NVIDIA显卡相关的问题,包括双屏无法检测、驱动无法通信等,现在他们想通过重启nvidia-smi来解决显示问题。 首先,我需要明确nvidia-smi是什么。nvidia-smiNVIDIA的系统管理接口,用于监控和管理GPU状态,但它本身不是一个服务,而是一个命令行工具。所以用户提到的“重启nvidia-smi”可能不太准确,因为nvidia-smi只是调用驱动接口的工具,无法直接重启。真正的解决可能涉及到重启相关驱动服务或重新加载模块。 接下来,回顾用户之前的对话历史,用户的问题涉及到驱动安装、X Server配置以及驱动切换。引用中提到的错误如“NVIDIA-SMI has failed because it couldn’t communicate with the NVIDIA driver”说明驱动可能未正确安装或加载。此外,用户可能尝试过切换驱动、重新安装驱动等方法,但问题依旧存在。 现在用户想重启nvidia-smi,但需要引导他们正确的解决步骤。正确的步骤可能包括检查驱动状态、重新加载内核模块、重启显示管理器等。此外,用户提到的“nvidia x screen 1未显示”可能与Xorg配置有关,需要检查X Server的日志或重新生成配置文件。 需要考虑用户可能的操作环境,如Ubuntu 16.04,这可能比较老旧,驱动支持可能有限。用户可能在使用虚拟机,但引用中提到VMware无法使用CUDA,所以需要确认是否是物理机。此外,用户可能之前尝试过切换驱动,但未成功,导致驱动状态异常。 接下来需要整理解决方案的步骤: 1. 检查驱动状态,确认驱动是否正确安装和加载。 2. 重新加载NVIDIA内核模块,可能需要卸载后重新加载。 3. 重启显示管理器(如lightdm或gdm)以重新启动X Server。 4. 验证Xorg配置是否正确,必要时重新生成。 5. 如果驱动损坏,可能需要重新安装驱动。 同时需要注意用户可能的权限问题,比如使用sudo命令。此外,用户可能需要更新驱动到适配其系统的版本,尤其是Ubuntu 16.04可能支持的驱动版本较旧。 另外,用户可能遇到的问题包括驱动冲突(如nouveau开源驱动未禁用),需要检查是否禁用了nouveau。此外,prime-select切换驱动是否执行正确,可能需要手动切换并重启。 最后,需要确保解决方案清晰易懂,步骤明确,避免用户操作时出现困惑。同时,提供相关问题帮助用户进一步排查,比如如何检查驱动版本、如何生成Xorg配置等。</think>### 如何重启 NVIDIA SMI 工具并解决显示问题 **核心分析** `nvidia-smi` 是 NVIDIA 显卡驱动的系统管理接口工具,它本身不是一个独立服务,无法直接“重启”。其运行依赖底层驱动和内核模块的加载状态。若出现 **NVIDIA X Screen 1 未显示** 或 `nvidia-smi` 无法通信的问题,通常与驱动未正确加载、X Server 配置冲突或内核模块异常有关。以下是具体解决方案: --- #### 步骤 1:验证驱动状态 1. **检查驱动是否加载** 运行以下命令确认 NVIDIA 内核模块是否已加载: ```bash lsmod | grep nvidia ``` 若输出包含 `nvidia`、`nvidia_modeset` 等模块,说明驱动已加载;若为空,则需手动加载或重装驱动[^3]。 2. **尝试重新加载内核模块** ```bash sudo rmmod nvidia_uvm nvidia_drm nvidia_modeset nvidia # 卸载模块(可能因依赖关系报错) sudo modprobe nvidia # 重新加载核心模块 ``` 若卸载失败,需重启系统后尝试[^3]。 --- #### 步骤 2:重启显示管理器与 X Server 显示问题通常与 X Server 配置或会话管理相关,可通过以下操作强制重启图形界面: ```bash sudo systemctl restart lightdm # 适用于 Ubuntu 默认的 LightDM 显示管理器 # 或 sudo systemctl restart gdm3 # 适用于 GNOME 的 GDM ``` 此操作会重启图形界面并重新初始化 X Server,可能解决屏幕未显示的问题[^1]。 --- #### 步骤 3:修复驱动通信问题 若 `nvidia-smi` 报错 **“Failed to communicate with NVIDIA driver”**,需修复驱动通信: 1. **切换专用驱动**(针对双显卡设备) ```bash sudo prime-select nvidia # 强制切换至 NVIDIA 驱动 sudo reboot ``` 2. **重装驱动**(若驱动损坏) 参考引用[4]中的方法,下载官方驱动并重新安装: ```bash sudo apt purge nvidia-* # 彻底清除旧驱动 sudo bash NVIDIA-Linux-x86_64-xxx.xx.run # 执行官方驱动安装包 ``` --- #### 步骤 4:验证 Xorg 配置 生成或修复 X Server 配置文件: ```bash sudo nvidia-xconfig --enable-all-gpus # 生成包含所有 GPU 的配置文件 sudo reboot ``` 此操作可强制 X Server 识别所有连接的屏幕[^2]。 --- ### 验证操作效果 - 运行 `nvidia-smi` 查看是否恢复正常输出。 - 使用 `xrandr --query` 检查 HDMI 或其他接口状态是否变为 **connected**。 --- ### 相关问题 1. 如何彻底卸载 NVIDIA 驱动并清理残留配置? 2.Ubuntu 中如何禁用 Nouveau 开源驱动以避免冲突? 3.显卡笔记本如何设置独立显卡为默认渲染设备? --- **关键提示**:若问题持续,建议检查系统日志(`journalctl -u lightdm` 或 `/var/log/Xorg.0.log`)排查具体错误[^1][^2]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

玩人工智能的辣条哥

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值