docker部署大模型ollama,无法使用GPU

最近再部署大模型玩

1.问题出现

docker版本如下

创建文件docker-compose.yml文件如下

name: 'ollama'
services:
  ollama:
    #restart: always
    image: ollama/ollama
    container_name: ollama13
    runtime: nvidia
    environment:
      - TZ=Asia/Shanghai
      - NVIDIA_VISIBLE_DEVICES=all
    networks:
      - ai-tier
    ports:
      - "11745:11434"
    volumes:
      - ./data:/root/.ollama
networks:
  ai-tier:
    name: ai-tier
    driver: bridge

启动容器 

docker compose up -d

报错:no compatible GPUs were discovered

no nvidia devices detected by library /usr/lib/x86 64-linux-gnu/libcuda.so.550.135

2.测试宿主机

curl -fsSL https://ollama.com/install.sh | sh
# 下载完成之后执行
ollama run llama3.2

在宿主机启动容器测试,可以正常调动GPU,说明驱动没有问题

3. 排查问题

测试能否调用GPU

docker run --rm --gpus all  nvidia/cuda:12.0.1-runtime-ubuntu22.04 nvidia-smi
[root@worker1 ~]# docker run -it --rm --gpus all nvidia/cuda:12.4.0-base-ubuntu22.04 nvidia-smi
Unable to find image 'nvidia/cuda:12.4.0-base-ubuntu22.04' locally
12.4.0-base-ubuntu22.04: Pulling from nvidia/cuda
bccd10f490ab: Pull complete 
edd1dba56169: Pull complete 
e06eb1b5c4cc: Pull complete 
7f308a765276: Pull complete 
3af11d09e9cd: Pull complete 
Digest: sha256:80d4d9ac041242f6ae5d05f9be262b3374e0e0b8bb5a49c6c3e94e192cde4a44
Status: Downloaded newer image for nvidia/cuda:12.4.0-base-ubuntu22.04
Failed to initialize NVML: Unknown Error

根据报错

修改配置文件

vim /etc/nvidia-container-runtime/config.toml

将图中no-cgroups=true改成

no-cgroups=false

此参数对任务使用的资源(内存,CPU,磁盘等资源)总额进行限制

 修改完成后,重启docker服务

systemctl restart docker

4.验证是否解决

docker run --rm --gpus all  nvidia/cuda:12.0.1-runtime-ubuntu22.04 nvidia-smi

至此问题解决

### 如何在GPU部署Ollama Docker容器 #### 使用Docker命令启动带有GPU支持的Ollama容器 为了使Ollama能够在配备NVIDIA GPU的环境中运行,需利用特定参数来配置Docker容器。这涉及到指定`--gpus all`选项以允许访问所有的可用GPU资源[^1]。 ```bash docker run --gpus all -d \ -v /data/ai/ollama:/root/.ollama \ -p 11434:11434 \ --name ollama \ ollama/ollama ``` 上述命令通过挂载主机上的目录至容器内路径`/root/.ollama`实现数据持久化存储,并开放端口用于外部通信。同时赋予该实例名称为`ollama`以便管理和识别。 #### 利用Docker Compose简化多服务编排流程 对于更复杂的场景或是希望采用声明式方式定义应用栈的情况下,则可以借助于Docker Compose工具。创建一个名为`docker-compose.yml`文件,在其中描述所需的服务及其依赖关系: ```yaml version: '3' services: ollama: image: ollama/ollama deploy: resources: reservations: devices: - capabilities: [gpu] volumes: - /data/ai/ollama:/root/.ollama ports: - "11434:11434" ``` 之后仅需一条简单的指令即可完成整个环境搭建工作[^2]: ```bash docker-compose up -d ollama ``` 此方法不仅能够有效减少重复劳动量,还便于团队协作开发过程中保持一致性。 #### 进入正在运行中的容器执行交互操作 当需要对已启动的服务进行调试或维护时,可以通过如下所示的方式获取shell权限并进一步加载大型预训练模型等任务: ```bash docker-compose exec -it ollama sh ``` 这样就可以直接在目标进程中开展后续的工作了。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值