前情提要:实验室的新服务器用的是nvidia 3090显卡,最近服务器出了点问题,师兄说是网卡驱动和显卡驱动有问题,但是我登录之后发现nvidia-smi命令无法输出,就认为是显卡驱动没有装好,遂开始自力更生配置环境。
首先,笔者输入了nvidia-smi命令,发现有如下报错:
NVIDIA-SMI has failed because it couldn’t communicate with the NVIDIA driver.
Make sure that the latest NVIDIA driver is installed and running.
于是联系前情提要,笔者想当然地认为是nvidia驱动没有安装好。
记录一下配置nvidia驱动的教程,以备不时之需。安装nvidia驱动教程
首先需要查看显卡型号,lspci | grep -i vga,但是该命令返回的是一个十六进制数字,根据:PCI devices确认了是3090显卡。(参考教程:Linux(Ubuntu)系统查看显卡型号)
但是在搜集资料的时候,笔者发现了如下参考资料。
参考链接:NVIDIA驱动失效简单解决方案
- 查看已安装驱动的版本信息
ls /usr/src | grep n

文章讲述了在服务器上遇到NVIDIA3090显卡驱动和CUDA环境问题,通过尝试安装和更新驱动、CUDA版本,最终发现只需在Anaconda环境中安装与显卡兼容的PyTorch版本即可解决问题,避免了服务器端直接安装CUDA的需要。
最低0.47元/天 解锁文章
9075

被折叠的 条评论
为什么被折叠?



