由于linux内核升级导致的:NVIDIA-SMI has failed because it couldn‘t communicate with the NVIDIA driver以及启动时修改内核的方法
跑了一段实验,发现cuda不能用了,第一反应是检查水冷怎么样,结果发现并没有问题,后来通过百度发现是linux内核升级导致的,通过这篇博客提供的方法NVIDIA驱动失效简单解决方案检查驱动和cuda都是没有问题的,
ll /usr/src/
sudo apt install dkms
sudo dkms install -m nvidia -v 525.147.05
驱动版本对应自己查到的版本。 但是最后一步还有问题,说没有找到该路径下的dkms.conf文件。
sudo dkms install -m nvidia -v 525.147.05
Error! Could not locate dkms.conf file.
File: /usr/src/nvidia-525.147.05/dkms.conf does not exist.
所以继续发挥优快云之力
修改启动内核
原因是ubuntu内核升级后,新的内核无法使用CUDA,非常难受。
首先查看目前的内核版本然后查看内核版本有哪些,输出如注释中显示
uname -r
#6.5.0-27-generic
grep menuentry /boot/grub/grub.cfg
#if [ x"${feature_menuentry_id}" = xy ]; then
# menuentry_id_option=