【AI开发：语言】二、Qwen1.5-7B模型本地部署CPU和GPU版

原创

已于 2024-04-21 20:17:35 修改 · 4.1k 阅读

20 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能

于 2024-04-16 20:07:44 首次发布

前言

之前文章，我们采用了Koblod运行Yi-34B大模型，本文采用LM Studio来运行千问模型。

LM Studio并没有开源，但是可以免费使用，他是目前本地进行模型测试最好的工具了。

在这里，依然使用Windows 10进行部署和测试，没有GPU。

注意：LM的运行速度相比较Kobold两者差不多，而且也提供WEB服务，稍后也研究下他的API功能，LM的功能更多一些有待开发。

完整工具包下载（均为官方版本）：AI开发工具包官方版下载丨最新版下载丨绿色版下载丨APP下载-123云盘123云盘为您提供AI开发工具包最新版正式版官方版绿色版下载,AI开发工具包安卓版手机版apk免费下载安装到手机,支持电脑端一键快捷安装https://www.123pan.com/s/b5zTTd-tyaH.html%E6%8F%90%E5%8F%96%E7%A0%81:rnwi

一、LM Studio下载

下载地址：LM Studio - Discover, download, and run local LLMs

二、模型下载

下载地址：AI快站 - HuggingFace模型免费加速下载

我们要从这里选择需要的模型。其他模型资源如下：

1.其他模型资源

国内厂商模型

序号	厂商	访问地

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

My的梦想已实现

关注关注

22
点赞
踩
20

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

专栏目录

开源模型应用落地-qwen1.5-7b-chat与vllm实现推理加速的正确姿势（八）

以微薄之力，予他人些许温暖.

03-01

3323

qwen1.5-7b-chat集成vllm，流式输出

开源模型应用落地-qwen1.5-7b-chat与vllm实现推理加速的正确姿势（九）

以微薄之力，予他人些许温暖.

03-04

2665

qwen1.5-7b-chat集成vllm，构建与OpenAI-API兼容的API服务

参与评论您还未登录，请先登录后发表或查看评论

LM Studio 本地部署大模型Qwen

chinagaobo的专栏

09-05

4002

LMStudio 本地部署Qwen 访问huggingface.co不畅，替换为hf-mirror.com

【LM Studio篇】不懂编程也能学会！几分钟教你在本地部署大模型

最新发布

Y525698136的博客

10-31

697

LM Studio是一个在本地部署大模型的桌面应用程序，它具有搜索、下载、运行模型的功能，可以管理多个模型，有聊天界面。

好用且简单的本地大模型聊天工具LM Studio

崎山小鹿的专栏

03-02

4483

使用LM Studio 我们就可以很方便的加载各种模型使用了，LM Studio是我目前见到最好用，也是最简单的本地测试AI模型的工具，不需要安装python环境以及众多的组件，加载模型、启用GPU、聊天都非常简单。而且可以切换很多不同类型的大语言模型，同时支持在Windows和MAC上的PC端部署。

部署和微调Qwen1.5-7B

kerrigenwan的博客

08-09

1328

小白微调部署语言模型笔记

[大模型]Qwen1.5-7B-Chat-GPTQ-Int4 部署环境

FL1623863129的博客

04-11

4121

Qwen1.5-72b 版本有BF16、INT8、INT4三个版本，三个版本性能接近。由于BF16版本需要144GB的显存，让普通用户忘却止步，而INT4版本只需要48GB即可推理，给普通用户本地化部署创造了机会。（建议使用4×24G显存的机器）但由于Qwen1.5-72B-Chat-GPTQ-Int4其使用了GPTQ量化技术，对环境依赖要求严格，需要较为复杂的环境准备步骤。在此提供环境准备教程。本教程以为例，同样适用于其他大小的GPTQ-Int4版本。

【记录】基于qwen/Qwen1.5-7B-Chat离线模型的chat应用

dopapapa的博客

06-05

502

使用 ngrok 将本地的 Gradio 服务器端口转发到公共 URL。# 输出公共 URL。

qwen2.5-7b vllm部署

11-15

qwen2.5-7b vllm部署依赖文件-vllm的知识点梳理： 1. vllm部署是指对vllm（Very Large Language Model）进行设置和启动的过程，这通常需要一系列特定的软件库和工具。qwen2.5-7b似乎是一个特定版本或特定环境下的...

ModelScope+Transformers+SwanLab实现Qwen-1.5-7b的指令微调任务

Kashiwa123的博客

06-03

1681

利用ModelScope+Transformers+SwanLab高效实现Qwen-1.5-7b的指令微调任务，以支持文本分类任务

Intel CPU 实战部署阿里大语言模型千问Qwen-1_8B-chat

英特尔开发人员专区

01-30

4984

利用 Intel 的大语言模型推理框架，我们可以实现大模型在 Intel 端侧设备的高性能推理。只需要 2G 内存占用就可以实现与本地大模型的流畅对话，一起来体验下吧。

[大模型]Qwen1.5-7B-Chat 接入 LangChain 搭建知识库助手

FL1623863129的博客

04-11

2187

在 autodl 平台中租赁一个 3090 等 24G 显存的显卡机器，如下图所示镜像选择 PyTorch–>2.0.0–>3.8(ubuntu20.04)–>11.8接下来打开刚刚租用服务器的 JupyterLab，并且打开其中的终端开始环境配置、模型下载和运行 demo。pip 换源加速下载并安装依赖包。

qwen1.5-7B hf部署运行方法以及vllm推理框架部署方法

magic_road的博客

02-21

3483

qwen1.5 模型的问答生成方式发生了变化，不再支持 mode.chat()，但整体来看， 1.5版本的问答效果确实有了很大提升。qwen-7B 大语言模型的加载方式如下。

通义千问本地部署教程 Qwen-1.5-1.8B/7B/14B Windows-详细认真版

热门推荐

一个学长的博客

02-26

7万+

实现了在Windows上部署通义千问的Qwen-7B-Chat Qwen-1.5-1.8B 模型且实现多轮对话和流式输出，目前还在更新。

[大模型]Qwen-1_8B-chat CPU 部署

FL1623863129的博客

04-18

2019

本文介绍了在 Intel 设备上部署 Qwen 1.8B 模型的过程，你需要至少16GB内存的机器来完成这项任务，我们将使用英特尔的大模型推理库来实现完整过程。Bigdl-llm 是一个在英特尔设备上运行 LLM（大语言模型）的加速库，通过 INT4/FP4/INT8/FP8 精度量化和架构针对性优化以实现大模型在英特尔 CPU、GPU上的低资源占用与高速推理能力（适用于任何 PyTorch 模型）。

cpu通过http接口部署qwen1.8b

weixin_49651327的博客

12-25

1946

1G大小的qwen1.8b部署包

【AI开发：语言】一、Yi-34B超大模型本地部署CPU和GPU版

04-16

2877

DeepSeek-R1-Distill-Qwen-1.5B 模型部署文档（cpu部署）

weixin_45075377的博客

02-12

1664

DeepSeek-R1-Distill-Qwen-1.5B 是一个基于 Qwen-1.5B 模型的知识蒸馏版本，适用于多种自然语言处理任务，如文本生成、问答、对话系统等。本文档将指导您如何部署该模型。

大模型的实践应用13-量化后的通义千问Qwen的18亿参数在CPU上的部署，最小2GB显存可跑，并利用两种文本流式方式输出

微学AI的博客

12-14

2229

大家好，我是微学AI，今天给大家介绍大模型的实践应用13-量化后的通义千问Qwen的18亿参数在CPU上的部署，最小2GB显存可跑，并利用两种文本流式方式输出。Qwen-1_8B-Chat是阿里云研发的通义千问大模型系列的18亿参数规模的模型。Qwen-1.8B是基于Transformer的大语言模型, 在超大规模的预训练数据上进行训练得到。预训练数据类型多样，覆盖广泛，包括大量网络文本、专业书籍、代码等。同时，在Qwen-1.8B的基础上，我们使用对齐机制打造了基于大语言模型的AI助手Qwen-1.8B-

win11系统，IP10.237.186.51，3060（12GB）显存，AI模型下载在D:\Qwen1.5\models\qwen\Qwen1.5-7B-Chat，我希望在以上条件上本地部署一个AI，达成一下功能。AI不进行对话功能，只使用翻译功能，用户可以选择源语言和目标语言。另外设计一个上传文件按钮，使用AI翻译上传的文件后以原格式输出。内网其他电脑可以通过IP访问AI，给出D:\Qwen1.5下详细文件夹里的文件和文件夹，并且给出每个文件的代码。

10-11