阿里千问大模型(Qwen2.5-VL-7B-Instruct)部署

参考链接

知乎帖子
B站视频
huggingface 镜像网站(不太全,比如 Qwen/Qwen2.5-VL-7B-Instruct就没有)
huggingface 5种下载方式汇总
通过huggingface-cli下载模型

在这里插入图片描述

不一样的部分是预训练权重的下载和demo

首先安装huggingface_hub

pip install -U huggingface_hub

设置镜像

export HF_ENDPOINT=https://hf-mirror.com

windows端需要添加系统变量。

名称:HF_ENDPOINT,值: "https://hf-mirror.com"

然后通过huggingface-cli下载模型,

huggingface-cli download --resume-download  Qwen/Qwen2.5-VL-7B-Instruct --local-dir ./ --local-dir-use-symlinks False --resume-download

参考:通过huggingface-cli下载模型

运行DEMO

加载模型方式

如果希望下载到指定的目录,可以往from_pretrained方法传入cache_dir 参数,如下所示:

import torch
from transformers import AutoTokenizer, 
### 阿里Qwen2.5-VL-7B多模态大模型本地部署教程 #### 准备工作 为了成功完成阿里Qwen2.5-VL-7B多模态大模型的本地部署,需先准备好必要的环境配置以及相关工具。具体操作如下: 1. **克隆代码仓库** 使用Git命令获取官方发布的Qwen2.5-VL项目源码并安装所需依赖项。执行以下命令可以实现这一目标: ```bash git clone https://github.com/QwenLM/Qwen2.5-VL.git cd Qwen2.5-VL pip install -r requirements.txt ``` 这一步骤确保了开发环境中具备运行该模型所需的全部Python包[^3]。 2. **下载模型文件** 下载完整的Qwen2.5-VL-7B模型权重至指定目录下以便后续加载使用。通过ModelScope平台提供的命令行工具可轻松完成此任务: ```bash modelscope download --model Qwen/Qwen2.5-VL-7B-Instruct --local_dir /path/to/local/directory ``` 此处`/path/to/local/directory`应替换为你希望存储模型的实际路径位置[^1]。 #### 启动服务端口 当准备工作完成后,则可以通过启动HTTP API服务器来对外提供推理接口访权限。利用vLLM框架能够显著提升性能表现水平,在实际测试过程中发现即使是拥有较大规模参数量级的大语言模型也能达到非常理想的响应速度效果。 启动指令如下所示: ```bash vllm serve Qwen/Qwen2.5-VL-7B-Instruct --port 8000 ``` 上述命令将会把监听地址绑定到本机IP上的8000端口号上等待客户端发起请求调用[^2]。 #### 测试验证环节 最后建议编写简单的脚本来检验整个流程是否正常运作无误。下面给出了一段基于Python SDK 的例子供参考学习之用: ```python import requests url = 'http://localhost:8000/v1/completions' payload = { "prompt": "你好", "max_tokens": 50, } headers = {"Content-Type": "application/json"} response = requests.post(url, json=payload, headers=headers) print(response.json()) ``` 以上即为针对阿里巴巴集团推出的最新一代超大规模预训练加微调优化后的版本——Qwen2.5系列中的视觉语言理解方向子型号(Qwen2.5-VL)实施本地化私有云端实例的具体实施方案概述说明文档内容总结整理而成的结果呈现形式之一部分而已[^1]^。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值