ubuntu系统启动出现如下报错信息:
Error response from daemon: failed to create shim: OCI runtime create failed: runc create failed: unable to start container process: error during container init: error running hook #0: error running hook: exit status 1, stdout: , stderr: Auto-detected mode as ‘legacy’
nvidia-container-cli: initialization error: nvml error: driver not loaded: unknown
看见的是一脸懵逼的样子,搜索很多优快云文章均没有得到解决,在要放弃的时候去重装驱动的时候,终于发现了一篇宝藏文章:docker调用gpu报错
特记录如下:
1、报错信息:

2、nvidia-smi 显示驱动丢失

3、查看已安装内核

4、查看正在使用的内核情况

5、解决方案
(1)apt-get install dkms

(2) dkms install -m nvidia -v 525.60.11 (525.60.11为nvidia的实际使用驱动编号)

6、结果
久违的驱动又出现了

以上为治标不治本的方法,发生上述问题的主要原因还是内核的更新,因此需要禁止内核的更新
文章描述了在Ubuntu系统中启动Docker时遇到GPU相关错误的问题,具体表现为驱动未加载。作者通过执行一系列步骤,包括安装dkms,手动安装nvidia驱动来解决问题。虽然这个方法解决了眼前的问题,但根源在于内核更新,建议长期解决方案是阻止内核自动更新。
6123

被折叠的 条评论
为什么被折叠?



