近期在跑模型时发现代码忽然停止运行,也没抛出异常或退出。重启服务器后,发现nvidia-smi命令会报错。
NVIDIA-SMI has failed because it couldn‘t communicate with the NVIDIA driver.
解决方案:
ls /usr/src | grep nvidia
这里我的驱动版本为 nvidia-510.73.05sudo apt-get install dkmssudo dkms install -m nvidia -v 510.73.05
安装完成即恢复正常。
还可使用nvidia-smi -pm 1进行该命令的加速。
近期跑模型时代码突然停止运行,无异常抛出或退出,重启服务器后命令报错。解决方案是安装驱动版本为 nvidia - 510.73.05,安装完成后恢复正常,还可使用相关命令加速。
1万+

被折叠的 条评论
为什么被折叠?



