本地如何使用docker部署和使用Xinference

以下是在本地使用 Docker 部署和运行 Xinference 的详细步骤,涵盖单机部署、模型加载、API 调用及常见问题解决方案:


一、部署前准备

1. 环境要求
  • 操作系统:Linux / macOS / Windows(WSL2)
  • Docker:版本 ≥ 20.10
  • GPU 支持(可选):需安装 NVIDIA Container Toolkit
2. 验证 Docker 环境
# 检查 Docker 是否正常运行
docker --version
docker run hello-world

二、单机部署 Xinference

1. 拉取 Xinference 镜像
docker pull xprobe/xinference:latest
2. 启动容器(根据硬件选择命令)
  • 仅 CPU 模式
  docker run -d -p 9998:9998 --name xinference xprobe/xinference:latest
  • 启用 GPU 加速(需 NVIDIA 驱动):
  docker run -d --gpus all -p 9998:9998 --name xinference xprobe/xinference:latest
3. 验证部署状态

访问 Web UI:[http://localhost:9998](http://localhost:9998),若看到管理界面则部署成功。


三、部署与使用模型

1. 通过命令行启动模型

进入容器内部操作:

docker exec -it xinference bash

启动常用模型:

# 启动 Rerank 模型(如 bge-reranker-large)
xinference launch --model-name bge-reranker-large --model-type rerank

# 启动 Embedding 模型(如 bge-large-en)
xinference launch --model-name bge-large-en --model-type embedding

# 启动 LLM(如 Llama3-8B)
xinference launch --model-name llama-3-8b-instruct --model-type LLM --size-in-billions 8 
<think>根据用户查询,用户希望了解在Windows系统上使用Docker部署Xinference的方法。结合引用内容,我整理出以下步骤: 1. **启用WSL2**:Windows系统需先启用WSL2(Windows Subsystem for Linux)虚拟机平台功能(引用[3])。 - 以管理员身份运行PowerShell,执行: ```powershell dism.exe /online /enable-feature /featurename:Microsoft-Windows-Subsystem-Linux /all /norestart dism.exe /online /enable-feature /featurename:VirtualMachinePlatform /all /norestart ``` - 重启计算机后,将WSL2设为默认版本:`wsl --set-default-version 2` 2. **安装Docker Desktop**: - 从[Docker官网](https://www.docker.com/products/docker-desktop)下载安装包。 - 安装时勾选"Use WSL 2 instead of Hyper-V"选项。 3. **拉取Xinference镜像并运行**: - 根据引用[2],使用GPU加速的命令如下: ```bash docker run -e XINFERENCE_MODEL_SRC=modelscope -p 9997:9997 --gpus all xprobe/xinference:latest xinference-local -H 0.0.0.0 --log-level debug ``` - 若仅使用CPU,可省略`--gpus all`参数: ```bash docker run -e XINFERENCE_MODEL_SRC=modelscope -p 9997:9997 xprobe/xinference:latest xinference-local -H 0.0.0.0 ``` 4. **验证部署**: - 浏览器访问`http://localhost:9997`,应看到Xinference的Web界面。 5. **管理容器**(引用[1]): - 停止服务:`docker stop xinference` - 启动服务:`docker start xinference` - 查看日志:`docker logs xinference` - 进入容器:`docker exec -it xinference bash` **常见问题**: - 若遇到`localhost`无法访问(引用[2]),检查防火墙是否放行端口9997,或尝试将`-H 0.0.0.0`改为`-H 127.0.0.1`。 §§相关问题§§ 1. 如何解决Windows下Docker部署Xinference时的端口冲突问题? 2. Xinference支持哪些大语言模型(LLM)的本地部署? 3. 如何在Xinference中加载Hugging Face模型?</think>### 在Windows系统使用Docker部署Xinference的方法 #### 步骤1:启用WSL2(必需前提) Windows系统需先启用WSL2虚拟机平台功能[^3]: 1. 以管理员身份打开PowerShell,执行: ```powershell dism.exe /online /enable-feature /featurename:Microsoft-Windows-Subsystem-Linux /all /norestart dism.exe /online /enable-feature /featurename:VirtualMachinePlatform /all /norestart ``` 2. 重启计算机 3. 设置WSL2为默认版本:`wsl --set-default-version 2` #### 步骤2:安装Docker Desktop 1. 从[官网](https://www.docker.com/products/docker-desktop)下载安装包 2. 安装时勾选 **"Use WSL 2 instead of Hyper-V"** 选项 3. 安装完成后启动Docker,在设置中确认WSL集成已启用 #### 步骤3:拉取并运行Xinference容器 根据硬件需求选择命令: - **GPU加速部署**(需NVIDIA显卡)[^2]: ```bash docker run -e XINFERENCE_MODEL_SRC=modelscope -p 9997:9997 --gpus all xprobe/xinference:latest xinference-local -H 0.0.0.0 --log-level debug ``` - **CPU模式部署**: ```bash docker run -e XINFERENCE_MODEL_SRC=modelscope -p 9997:9997 xprobe/xinference:latest xinference-local -H 0.0.0.0 ``` #### 步骤4:验证部署 1. 打开浏览器访问:`http://localhost:9997` 2. 应显示Xinference的Web管理界面 3. 在终端查看日志确认状态:`docker logs <容器ID>` #### 常用管理命令[^1] ```bash # 停止服务 docker stop xinference # 启动服务 docker start xinference # 进入容器终端 docker exec -it xinference bash ``` #### 常见问题解决 1. **localhost无法访问**[^2]: - 检查防火墙是否放行9997端口 - 尝试将命令中的`-H 0.0.0.0`改为`-H 127.0.0.1` - 在Docker设置中重置WSL集成 2. **GPU未识别**: - 确保已安装[NVIDIA Container Toolkit](https://docs.nvidia.com/datacenter/cloud-native/container-toolkit/latest/install-guide.html) - 在Docker设置中启用"NVIDIA GPU"支持
评论 3
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

飘逸高铁侠

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值