windows+WSL（ubuntu22）下的通义千问（7B-Chat）部署、lora微调初探

原创

已于 2024-01-12 21:43:26 修改 · 1.6k 阅读

20 ·

CC 4.0 BY-SA版权

文章标签：

#windows #ubuntu #语言模型 #人工智能

于 2024-01-12 02:58:02 首次发布

1. cuda版本

cuda建议11.8，之前使用的12.1，但遇到一些问题降级到11.8了，但忘了是啥库装不上了，目前11.8肯定能用，web能打开、lora能简单跑。

python版本是3.10。

2. 下载模型和项目

> 通义千问-7B-Chat · 模型库 (modelscope.cn)

使用git

#模型
git clone https://www.modelscope.cn/qwen/Qwen-7B-Chat.git
#项目
git clone https://github.com/QwenLM/Qwen.git

模型的缺省目录是项目下的 Qwen\Qwen-7B，可以酌情放置，并在项目的各种.py中进行调整。

3. 有关WSL（windows linux子系统）

好处是下载的各种东西直接放到windows里，ubuntu子系统可以在/mnt中直接读取，很方便。

参见：

WSL2+ubuntu2004+cuda11.8+cudnn8.8开发环境搭建

我是用的ubuntu版本是2204，也没问题。基于该文部署好cuda

最低0.47元/天解锁文章

200万优质内容无限畅学

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

robinhou23

关注关注

26
点赞
踩
20

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

【深度学习】微调通义千问模型：LoRA 方法，微调Qwen1.8B教程，实践

q742971636的博客

02-23

3948

与全参数微调不同，LoRA和Q-LoRA的训练只需存储adapter部分的参数。假如你需要使用LoRA训练后的模型，你需要使用如下方法。在本篇博客中，我们将介绍如何使用 LoRA 方法微调通义千问模型，以适应特定任务或数据。首先，我们将简要介绍准备数据和运行微调所需的步骤，然后详细说明如何执行 LoRA 微调。首先，您需要准备您的训练数据，并将其存储为 JSON 文件。通过以上步骤，您就可以成功运行 LoRA 方法对通义千问模型进行微调了。在开始微调之前，请确保设置好网络代理，以确保能够顺利访问所需资源。

通义千问本地部署教程 Qwen-1.5-1.8B/7B/14B Windows-详细认真版

热门推荐

一个学长的博客

02-26

6万+

实现了在Windows上部署通义千问的Qwen-7B-Chat Qwen-1.5-1.8B 模型且实现多轮对话和流式输出，目前还在更新。

1 条评论您还未登录，请先登录后发表或查看评论

【通义千问】大模型Qwen GitHub开源工程学习笔记（5）-- 模型的微调【全参数微调】【LoRA方法】【Q-LoRA方法】

weixin_46481662的博客

01-07

2925

注意，如果你使用预训练模型进行LoRA微调，而非chat模型，模型的embedding和输出层的参数将被设为可训练的参数。秩分解矩阵可以看作是一种特殊的调料，它可以改变模型的行为，使模型更好地适应新的任务，但并不会改变原有的食材（即预训练模型的权重）。相比之下，LoRA将预训练模型的权重冻结，并在转换器架构的每一层注入可训练的秩分解矩阵。这意味着在这种方法中，原始的预训练权重 W 是固定的，不会在后续的训练过程中进行更新，而是只对 A 和 B 进行训练。在全参数微调中，所有的模型参数都会被重新训练。

利用WSL2本地部署-通义千问Qwen-7B-Chat

qq_43687808的博客

09-04

4454

通义千问-7B（Qwen-7B）是阿里云研发的通义千问大模型系列的70亿参数规模的模型。Qwen-7B是基于Transformer的大语言模型, 在超大规模的预训练数据上进行训练得到。预训练数据类型多样，覆盖广泛，包括大量网络文本、专业书籍、代码等。同时，在Qwen-7B的基础上，我们使用对齐机制打造了基于大语言模型的AI助手Qwen-7B-Chat。本仓库为Qwen-7B-Chat的Int4量化模型的仓库。评测表现ModelMMLUC-EvalGSM8KHumanEvalCMMLU。

【AI】ubuntu 22.04 RTX4060TI 16G 本地部署通义千问 7B模型

hknaruto的专栏

04-10

3211

下载模型中途下载报错，手动下载几个没有正常拉下来的模型文件移动过来。

【Ubuntu20.04部署通义千问Qwen-7B，实测成功】

AI小生~小陶的博客

02-20

5345

Ubuntu20.04，部署通义千问大模型，Qwen-7B，2080Ti

基于lora的通义千问qwen大模型微调实战

IT大头的博客

12-22

8873

基于通义千问qwen官方微调实例的1.8b的最小大模型lora微调，目前是基于单卡单机微调最简单实操，Qwen微调

qwen2.5-7b 部署

11-15

标题 "qwen2.5-7b 部署" 暗示本文将详细讨论关于名为 "qwen2.5-7b" 的软件或系统部署过程中的必要步骤和技术细节。从给定的文件信息来看，该部署过程涉及到一系列复杂的依赖关系和依赖文件的管理。部署所依赖的文件...

Win11 + WSL + Ubuntu 22.04 LTS + ROS2 安装记实

clovejava的专栏

07-08

7262

本文介绍 Windows11系统中，使用WSL安装Ubuntu22.04LTS，并且在Ubuntu里安装ROS2，最后完成测试。

ubuntu-wsl2-systemd-script：用于在当前Ubuntu WSL2映像上启用systemd支持的脚本

01-30

“ubuntu-wsl2-systemd-script”是一个专为在Windows Subsystem for Linux 2（WSL2）的Ubuntu环境中启用systemd服务管理的脚本。它旨在帮助用户在WSL2的Ubuntu映像中模拟更接近于传统Linux服务器的运行环境，使得...

win11+WSL+Ubuntu-22.04安装桌面+VNC

weixin_52033229的博客

02-19

2133

Window11下WSL2的安装

十分钟学会微调大语言模型

2301_81888214的博客

04-19

2212

本文就来介绍一种大语言模型微调的方法，使用的工具是我最近在用的 Text Generation WebUI，它提供了一个训练LoRA的功能。

本地部署离线通义千问-1_8B-Chat与通义千问-14B-Chat模型及使用Lora方法对它们进行微调与验证（非常详细，值得大家借鉴且效果比Chatglm3-6B微调效果好）

nfkjdx的博客

03-22

8508

Centos7下部署和微调通义千问大模型，效果优于chatglm3-6B，且效果很佳

大模型部署手记（22）Ubuntu+TensorRT-LLM+通义千问

张小白

10-31

1626

Ubuntu+TensorRT-LLM+通义千问

通义千问1.8B大模型推理、微调手把手保姆级教学

qq_36366417的博客

05-10

7924

本文介绍了使用通义千问1.8B开元大模型进行推理、微调的一些内容

Windows 搭建自己的大模型-通义千问

lxw1005192401的博客

04-24

902

将DEFAULT_CKPT_PATH参数改为模型下载的路径：D:/Qwen/Qwen-7B-Chat。检出模型到本地目录，例如：D:\Qwen\Qwen-7B-Chat。检出的项目为启动项目：Qwen-7B，不包含预训练好的模型文件。再次进行步骤3的python文件执行命令。6、启动 openai api 形式的接口。找到web_demo.py文件，如图。5、修改启动项目：Qwen-7B。1、安装 pytorch。2、拉取代码并安装依赖。浏览器访问即可，如图。

Windows本地部署通义千问QwQ-32B实践，阿里千问QwQ-32B推理模型开源，比肩671B满血DeepSeek-R1！笔记本就能跑