最近在跑深度学习的代码的时候突然出现这样的情况:昨天还能跑的代码,今天就突然崩了。然后发现
nvidia-smi no devices were found。???这就一脸懵!!!网上查资料说是驱动问题,需要重装显卡驱动。由于我的设备是远程连接的别人的设备,只能放弃。突发奇想,让他一直nvidia-smi,查了一下ubuntu下命令是这样子:watch -n 0.1 -d nvidia-smi就是每0.1s查看一次显卡。奇迹诞生!!!!!!!
nvidia-smi no devices were found的“奇技淫巧”
最新推荐文章于 2025-10-30 11:56:42 发布
博主在运行深度学习代码时遇到突然崩溃的问题,发现提示nvidia-smi找不到设备。通过调查,认为可能是显卡驱动问题。由于无法直接操作远程设备,尝试使用`watch -n0.1 -dnvidia-smi`命令持续监控显卡状态,最终问题意外解决。此博客分享了这一奇特的解决经验。
2万+

被折叠的 条评论
为什么被折叠?



