docker: Error response from daemon: could not select device driver ““ with capabilities: [[gpu]] 解决

在执行docker run --gpus 的时候报错,是因为重装显卡驱动后导致不可用,重新安装一遍NVIDIA Container Toolkit 即可解决问题

问题:

root@itserver03:/home/develop# docker run -itd --gpus all -p 8000:8000 -v /u01/workspace/models:/u01/workspace/models qingcloudtech/cogvlm:v1.1
bd0d38517f56afeecd2a6156bd8a3cd754e646999fad9a347d49cdc243f87341
docker: Error response from daemon: could not select device driver "" with capabilities: [[gpu]].

解决方式:

https://blog.youkuaiyun.com/tanlintanlin/article/details/138597128?spm=1001.2014.3001.5501

Ubuntu下安装部署

第一步:配置仓库
curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg \
  && curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list | \
    sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' | \
    sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list
第二步:下载安装
#更新
sudo apt update
#安装nvidia-container-toolkit
sudo apt install nvidia-container-toolkit

第三步,配置运行

注意: 如果容器用是containerd: 请使用sudo nvidia-ctk runtime configure --runtime=containerd

sudo nvidia-ctk runtime configure --runtime=docker
sudo systemctl restart docker
第四步:验证

注意上面只是安装了一个NVIDIA Container Toolkit生成器,如果希望生成各种版本的cuda镜像,需要下面语句:

 docker run --gpus all --rm nvidia/cuda:9.0-base nvidia-smi

docker run --gpus all --rm nvidia/cuda:11.0-base nvidia-smi
第五步:检查images
docker images

可以看到生成的镜像。

### 解决 CentOS 上 Docker 设备驱动选择错误的问题 当遇到 `docker: Error response from daemon: could not select device driver "" with capabilities: [[gpu]]` 错误时,这通常意味着 Docker 容器无法找到合适的 GPU 驱动程序来满足请求中的能力需求[^1]。 #### 一、确认 NVIDIA 驱动安装情况 确保主机已经正确安装了适用于 CUDA 的 NVIDIA 显卡驱动。可以通过命令 `nvidia-smi` 来验证这一点;如果该命令返回有关 GPU 使用状态的信息,则说明驱动已成功安装并配置好环境变量路径[^2]。 #### 二、设置必要的内核模块加载选项 对于某些 Linux 发行版来说,在启动过程中可能不会自动加载所需的 nvidia 模块。编辑 `/etc/modules-load.d/nvidia.conf` 文件并向其中添加如下内容: ```bash nvidia nvidia_uvm nvidia_modeset ``` 之后重启计算机使更改生效。 #### 三、安装 Nvidia Container Toolkit 为了使得容器能够访问到宿主机上的GPU资源,需要额外安装NVIDIA提供的官方工具包——NVIDIA Container Toolkit: ```bash distribution=$(. /etc/os-release;echo $VERSION_ID) curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add - curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list sudo yum install -y nvidia-container-toolkit sudo systemctl restart docker ``` 注意上述脚本针对的是基于Debian/Ubuntu系统的操作指南,请根据实际使用的Linux发行版本调整相应的软件源地址以及包管理器指令。 #### 四、运行带有 GPU 支持的 Docker 容器 完成以上准备工作后就可以尝试再次拉取支持CUDA加速计算功能镜像,并指定相应参数让其可以正常使用GPU硬件设施了。例如使用Theano框架进行科学运算时可参照下面的方式执行: ```bash sudo docker pull kaixhin/cuda-theano:latest sudo docker run --gpus all -it kaixhin/cuda-theano:latest bash ``` 这里通过`--gpus all` 参数告诉Docker守护进程允许当前会话内的应用程序调用所有的可用图形处理器单元来进行密集型任务处理工作。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值