[OpenAI-Agent-SDK] 离线接入本地vllm部署的QWQ-32B

OpenAI-Agent-SDK离线接入本地QwQ-32B

最近刚开始openai-agents-sdk的使用,发现在流程设计,agent 配置以及调用方面确实做到了极为精简,格式化输入与输出也非常方便控制,虽然OpenAI-agents-sdk原生支持openai自家提供的模型,不过在这“群模林立”的形势下,OpenAI-agents-sdk也良心地支持外部模型的接入和使用。

官方文档: https://openai.github.io/openai-agents-python/

比如接入本地部署的QwQ-32B,需要导入 AsyncOpenAI,OpenAIChatCompletionsModel, 与使用OpenAI 客户端类似,配置本地部署的QwQ-32B模型如下:

external_client = AsyncOpenAI(api_key='empty',base_url='http://192.168.xxx.xxx:pppp/v1/')

external_model = OpenAIChatCompletionsModel(model='QwQ-32B-AWQ', openai_client=external_client)

需要说明的是,

1)vllm部署模型信息可通过http://192.168.xxx.xxx:pppp/v1/models 来查询;其中返回的模型id为 'QwQ-32B-AWQ',即是OpenAIChatCompletionsModel中model传入的名称。

2)使用本地模型,则需要将tracing 关掉,即: set_tracing_disabled(disabled=True) 

3)使用 `function_tool` 装饰器来自定义工具。

一个天气查询助手的完整代码如下,


                
### 部署和使用 vllm/vllm-openai QwQ-32B 模型 为了在 `sudo` 环境下成功部署并运行 vllm/vllm-openaiQwQ-32B 模型,需遵循一系列特定的操作指南。 #### 安装必要的依赖项 确保所有必需的软件包都已安装。对于大多数 Linux 发行版而言,可以利用 `apt-get` 来完成此操作: ```bash sudo apt-get update && sudo apt-get upgrade -y sudo apt-get install python3-pip git cmake build-essential libssl-dev -y ``` #### 创建虚拟环境 (可选) 虽然不是强制性的,但在独立的 Python 虚拟环境中工作有助于管理项目依赖关系: ```bash python3 -m venv myenv source myenv/bin/activate pip install --upgrade pip setuptools wheel ``` #### 获取 VLLM 仓库及其子模块 克隆官方 GitHub 存储库,并初始化任何所需的 Git LFS 文件或子模块: ```bash git clone https://github.com/vllm-project/vllm.git cd vllm git submodule init git submodule update ``` #### 安装 Python 库 根据文档说明来设置开发环境,通常涉及安装 PyTorch 和其他依赖项: ```bash pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu117 pip install -e . ``` #### 下载预训练模型权重 考虑到资源消耗较大,建议提前下载好所需的大规模语言模型参数文件至本地存储位置: ```bash mkdir models && cd models wget http://path_to_model_weights/QWQ_32B.bin ``` #### 启动服务端口监听 最后一步是在 WSL2 上通过命令行启动服务器实例,以便能够远程访问 API 接口: ```bash export MODEL_PATH=/abs/path/to/models/QWQ_32B/ nohup python serve.py --model $MODEL_PATH & ``` 以上过程描述了如何在一个具有超级用户权限 (`sudo`) 的环境中准备、配置以及激活基于 vllm 开源项目的大型语言处理框架[^1]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

chenxin0215

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值