问题分析
在进行nvidia-smi的时候, 发现输出如下错误,
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver.
Make sure that the latest NVIDIA driver is installed and running.
搜索的网上的资源, 大多都是说要重新安装CUDA, 或者升级Linux headers之类的, 比较麻烦, 所以我想看看有没有其他的办法.
原因分析: nvidia driver不能正常运行, nvidia-smi依赖driver, 因此输出错误.
首先想到是重新安装下合适版本的driver, 但是近来机器没人动, 因此这个方法没有奏效.
然后, 我发现之前需要的一个包libstdc++被升级了, 所以尝试把相应的版本降下去, 然后重启下, 居然好了!
总结: 如果突然出现这个错误, 先定位到出错的原因, 再把修改放回去, 比重新安装cuda之类的好的多.
参考资源:

本文分析了在使用nvidia-smi时遇到的错误“NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver”及其解决方案。文章指出,该问题可能是由于nvidia驱动无法正常运行导致,并提供了一个简单的解决方法:降级libstdc++版本并重启。
最低0.47元/天 解锁文章
5万+

被折叠的 条评论
为什么被折叠?



