docker内部执行nvidia-smi无任何显示的解决方法
贺志国
2023.4.11
今天在Docker内部编译程序,发现与CUDA相关的代码居然没有编译,于是在Docker内部执行Nvidia显卡驱动检测命令nvidia-smi,执行完毕后,无任何输出,也没有任何报错信息,但在Docker外部执行该命令,结果如下图所示,没有任何异常:

最开始我以为是Docker启动有问题,于是连续重启两次,仍然是nvidia-smi命令无任何输出。仔细观察启动Docker的提示,说是Docker内部的Nvidia显卡驱动异常,未能启用Nvidia显卡,于是按照Nvidia官方网站https://docs.nvidia.com/datacenter/cloud-native/container-toolkit/install-guide.html#docker的方法重新安装NVIDIA Container Toolkit。安装命令罗列如下(我也是在官网抄过来的):
# 重新安装Docker
curl https://get.docker.com |

文章描述了在Docker容器中执行nvidia-smi命令无响应的故障,以及通过重新安装NVIDIAContainerToolkit,特别是处理Docker源冲突的步骤来解决问题的过程。最终,通过清理重复的安装源并重启Docker,成功在Docker内部运行nvidia-smi并显示Nvidia显卡信息。
最低0.47元/天 解锁文章
1万+

被折叠的 条评论
为什么被折叠?



