Qwen2.5环境搭建&推理测试

最新推荐文章于 2025-04-10 09:00:00 发布

要养家的程序猿

最新推荐文章于 2025-04-10 09:00:00 发布

阅读量1.1k

点赞数 4

分类专栏： AI算法文章标签： python 算法 ai 人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/zzq1989_/article/details/142919147

版权

AI算法专栏收录该内容

50 篇文章

订阅专栏

引子

2024年9月19号，阿里推出Qwen2.5全家桶，各种尺寸的都有。9月29日消息，基准测试平台Chatbot Arena日前公布最新大模型盲测榜单，10天前发布的阿里通义千问开源模型Qwen2.5再次闯入全球十强，其大语言模型Qwen2.5-72B-Instruct排名LLM榜单第十，是前十唯一的中国大模型；Qwen系列视觉语言模型Qwen2-VL-72B-Instruct排名Vision榜单第九，是得分最高的开源大模型。这次这种全尺寸的，我们要选就选一个最小的吧，0.5B的，OK，那就让我们开始吧。

一、模型介绍

Qwen2.5是Qwen大型语言模型系列的最新成果。对于Qwen2.5，我们发布了从0.5到720亿参数不等的基础语言模型及指令调优语言模型。Qwen2.5相比Qwen2带来了以下改进：

1、显著增加的知识量，在编程与数学领域的能力有了极大提升，这得益于我们在这些领域的专业专家模型。

2、在遵循指令、生成长文本（超过8K个token）、理解结构化数据（如表格）及生成特别是JSON格式的结构化输出方面有显著提升。对系统提示的多样性更具韧性，增强了聊天机器人的角色扮演实现和条件设定功能。

3、支持长上下文，最多可达128K个token，并能生成最多8K个token的文本。

4、支持超过29种语言的多语言能力，包括中文、英语、法语、西班牙语、葡萄牙语、德语、意大利语、俄语、日语、韩语、越南语、泰语、阿拉伯语等。

二、环境搭建

1、模型下载

2、代码下载

git clone GitHub - QwenLM/Qwen2.5: Qwen2.5 is the large language model series developed by Qwen team, Alibaba Cloud.

2、环境安装

docker run -it --rm --gpus=all -v /datas/work/zzq:/workspace pytorch/pytorch:2.4.0-cuda12.4-cudnn9-devel bash

pip install transformers==4.37.0 -i Simple Index

pip install accelerate==0.26.0 -i Simple Index

pip install auto-gptq -i Simple Index

pip install optimum -i Simple Index

三、推理测试

cd /workspace/Qwen2.5/Qwen2.5-main/examples/demo

python cli_demo.py

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

要养家的程序猿 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。