Qwen大模型Lora微调-Windows

帅东

已于 2024-11-23 16:29:02 修改

阅读量1.3k

点赞数 8

CC 4.0 BY-SA版权

文章标签：语言模型 Lora 微调

于 2024-11-23 16:12:46 首次发布

本文链接：https://blog.youkuaiyun.com/PROGRAM_anywhere/article/details/143992946

环境要求

python 3.8 and above
pytorch 1.12 and above, 2.0 and above are recommended
transformers 4.32 and above
CUDA 11.4 and above are recommended (this is for GPU users, flash-attention users, etc.)

微调步骤

1. 资源下载

Qwen：https://github.com/QwenLM/Qwen
qwen1_8B模型：https://modelscope.cn/models/Qwen/Qwen-1_8B-Chat
torch：https://download.pytorch.org/whl/torch_stable.html
flash-attention：https://github.com/Dao-AILab/flash-attention/releases/

2. 环境安装

conda create -n qwen python==3.10.1

# 安装torch
pip install "F:\llm\ptorch\torch-2.1.2+cu121-cp310-cp310-win_amd64.whl"

# 依赖
cd F:\github\Qwen
pip install -r requirements.txt

# 模型推理 web依赖包 图形化界面
pip install -r requirements_web_demo.txt

# 直接安装如果有问题，那就手动下载，本地安装
pip install "peft<0.8.0" deepspeed

# 非必须，模型加速，使用上面的连接下载到本地然后安装，手动编译我3个小时没编译完
pip install F:\llm\flash_attn-2.4.1+cu121torch2.1cxx11abiFALSE-cp310-cp310-win_amd64.whl

# 模型
git clone https://www.modelscope.cn/Qwen/Qwen-1_8B-Chat.git

3. 准备微调数据

看官网的微调格式：

[{
   "id":"identity_0","conversations":[{
   "from":"user","value":"你好"},{
   "from":"assistant","value":"我是一个语言模型，我叫通义千问。"}]}]

准备数据如下：
DISC-Law-SFT-Triplet-released-Qwen.json<

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

帅东

关注关注

8
点赞
踩
26

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

开源模型应用落地-qwen2-7b-instruct-LoRA微调-Axolotl-单机多卡-RTX 4090双卡（七）

没有卑微的工作，只有卑微的心态，与其抱怨，不如埋头实干

08-16

1万+

使用Axolotl高效微调qwen2-7b-instruct

开源模型应用落地-qwen2-7b-instruct-LoRA微调-LLaMA-Factory-单机单卡-V100（八）

没有卑微的工作，只有卑微的心态，与其抱怨，不如埋头实干

08-21

8369

使用LLaMA-Factory高效微调qwen2-7b-instruct

参与评论您还未登录，请先登录后发表或查看评论

lora微调大模型Qwen2.5_32B

lft_happiness的博客

11-26

3735

lora微调大模型Qwen2.5_32B，包括数据准备，设置参数，模型微调具体步骤，模型推理和模型合并的具体实践过程

在window平台大模型LoRA微调实战（完整代码带数据）

qyhua的专栏

07-24

3745

本次微调最开始是打算使用Qwen/Qwen-1_8B-Chat的模型作为微调对象，调试过程中不断报GPU显存不够，该模型需要的显存超过12G，因此后面改用 Qwen/Qwen1.5-0.5B-Chat 模型。这里的注意力投影与多层感知的层作是："c_attn", "c_proj", "w1", "w2"从上面对比图可以看出，微调后的回答的答案与模型合并的模型都差不多效果，比较准确。微调前回复答案明显多了一些不像关键字的没有微调后的好，说明确实有效果。方法保存微调后的模型到指定目录。我们调整大模型哪些层，

保姆级教程：零代码基础也能微调Qwen3，并本地部署，收藏这一篇就够了！！

最新发布

bugyinyin的博客

05-07

1628

我将在本文介绍如何通过 unsloth 框架以 LoRA 的方法微调 Qwen3-14B 模型。我们将在本文介绍如何微调使模型成为一个"双重人格"的助手，既能进行普通闲聊，又能在需要时切换到更严谨的思考模式来解决复杂问题，特别是数学问题。简而言之，微调后的模型获得的能力

lora微调Qwen模型全流程

qq_62231627的博客

07-28

4416

LoRA（Low-Rank Adaptation）是一种用于大模型高效微调的方法。通过对模型参数进行低秩分解和特定层的微调，LoRA 能在保持模型性能的前提下显著减少训练所需的参数量和计算资源。接下来是对 LoRA 微调 Qwen 模型的完整技术流程概述：模型和分词器加载首先，从预训练模型库中加载预训练的 Qwen 模型和分词器。预训练模型是大规模语料上训练的通用语言模型，能够为特定任务提供强大的语言理解和生成能力。配置 LoRA。

LLM - Qwen-72B LoRA 训练与推理实战

BITDDD小栈

02-05

9959

LLM Qwen-72B 简介与 LoRA 微调、推理。

基于 Qwen2 大模型微调技术详细教程（LoRA 参数高效微调和 SwanLab 可视化监控）

老牛啊

07-20

3778

本教程详细介绍了 LoRA 参数高效微调技术，包括数据集准备和处理、模型加载、参数设置等，然后以 Qwen2-0.5B 预训练模型实践，进行了文本分类能力微调，微调过程通过 SwanLab 可视化界面查看，最终微调模型进行测试数据评估……

开源模型应用落地-qwen2-7b-instruct-LoRA微调-Axolotl-单机单卡-V100（九）

没有卑微的工作，只有卑微的心态，与其抱怨，不如埋头实干

08-22

7536

使用Axolotl高效微调qwen2-7b-instruct

开源模型应用落地-qwen1.5-7b-chat-LoRA微调-Firefly（四）

没有卑微的工作，只有卑微的心态，与其抱怨，不如埋头实干

04-02

1万+

使用开源的Firefly大模型训练项目微调qwen1.5-7b-chat模型

Qwen-VL大模型LoRA微调、融合及部署

songyang66的博客

07-19

4126

Qwen-VL大模型LoRA微调、融合及部署

基于 Qwen2-1.5B Lora 微调训练医疗问答任务

2301_76168381的博客

11-17

902

模型回答：根据你的叙述，胃炎胆汁反流性胃炎的可能性大，建议口服奥美拉唑，吗丁啉救治，清淡易消化饮食，忌辛辣打击食物，留意歇息，不要加班除了正规救治胃痛外，患者还需要有看重护理方面，比如恰当饮食，始终保持心情愉快。收录了近两年151个优秀的大模型落地应用案例，这些案例覆盖了金融、医疗、教育、交通、制造等众多领域，无论是对于大模型技术的研究者，还是对于希望了解大模型技术在实际业务中如何应用的业内人士，都具有很高的参考价值。帮助很多人得到了学习和成长。层，做一个降维再升维的操作，模型的输入输出维度不变，来模拟。

开源模型应用落地-qwen模型小试-合并Lora模型-进阶篇（八）

没有卑微的工作，只有卑微的心态，与其抱怨，不如埋头实干

03-15

1833

qwen-7b-chat基座模型与微调后的lora模型进行合并

Qwen-7B私有化部署及LoRA微调

cici_v_的专栏

01-25

4266

Qwen7B大模型部署及微调

Ubuntu22.04本地部署qwen模型、jupyterlab开发环境、LoRA微调全流程

weixin_42118737的博客

05-18

3464

这段时间在自己的Win11系统上部署了chatGLM以及Qwen模型，进行对话、推理以及工具调用都没有问题，但是在尝试进行微调的时候发现好像并不能成功，因此花费了很大的力气，又分别在ubuntu桌面版、windows子系统WSL2 Ubuntu上部署了Qwen模型，并尝试进行LoRA的微调实践。由于过程比较多，步骤较为繁琐，我可能会分几个部分进行叙述。首先介绍一下我的两个环境（平民玩家，勿喷）：一台笔记本安装的Ubuntu22.04桌面版：显卡是1070M 8G。

开源模型应用落地-qwen1.5-7b-chat-LoRA微调代码拆解

没有卑微的工作，只有卑微的心态，与其抱怨，不如埋头实干

04-06

2752

深入学习qwen1.5-7b-chat模型官方微调脚本

【全网首发】使用 LoRA 微调 Qwen2.5-VL-7B-Instruct：完整流程解析

热门推荐

HovChen的博客

01-28

1万+

本篇文章介绍了如何使用 LoRA（Low-Rank Adaptation）技术对 Qwen2.5-VL-7B-Instruct 进行轻量级微调，从而高效适配特定任务。我们详细解析了模型加载、数据预处理、LoRA 适配、训练配置及推理评估的完整流程，并提供了代码示例。通过 LoRA，我们可以在较低计算资源下快速微调大规模视觉-语言模型（VLMs），使其更适用于特定领域任务。对于希望优化 Qwen2.5-VL 并实现高效微调的开发者，本文提供了一套实用的解决方案。🚀

(附数据集)基于lora参数微调Qwen1.8chat模型的实战教程

小知的博客

03-16

4491

与全参数微调不同，LoRA和Q-LoRA的训练只需存储adapter部分的参数。使用LoRA训练后的模型，可以选择先合并并存储模型（LoRA支持合并，Q-LoRA不支持），再用常规方式读取你的新模型。一般会缓存到你的C盘或用户空间，所以要根据自己情况查看模型。也可以通过下面日志查看模型所在位置，如。使用微调后且合并的模型进行本地部署。阿里魔搭社区notebook的。觉得不错，点个star噢。里：下载模型会缓存在。克隆Qwen项目，调用。文件进行配置与微调。

【深度学习】微调通义千问模型：LoRA 方法，微调Qwen1.8B教程，实践

q742971636的博客

02-23

3904

与全参数微调不同，LoRA和Q-LoRA的训练只需存储adapter部分的参数。假如你需要使用LoRA训练后的模型，你需要使用如下方法。在本篇博客中，我们将介绍如何使用 LoRA 方法微调通义千问模型，以适应特定任务或数据。首先，我们将简要介绍准备数据和运行微调所需的步骤，然后详细说明如何执行 LoRA 微调。首先，您需要准备您的训练数据，并将其存储为 JSON 文件。通过以上步骤，您就可以成功运行 LoRA 方法对通义千问模型进行微调了。在开始微调之前，请确保设置好网络代理，以确保能够顺利访问所需资源。

Qwen-VL大模型LoRA微调

03-13

### Qwen-VL 大模型 LoRA 微调方法与指南对于大型多模态预训练模型如Qwen-VL，在实际应用中通常会通过少量数据进行微调来适应特定的任务需求。低秩自适应（Low-Rank Adaptation, LoRA）是一种有效的参数高效迁移学习技术，能够显著减少所需调整的参数量并保持良好的性能。 #### 准备工作为了对Qwen-VL实施LoRA微调，需先安装必要的库工具包[^2]： ```bash pip install bmtrain transformers peft ``` 这里`bmtrain`提供了高效的分布式训练支持；而`transformers`和`peft`则分别用于加载基础模型以及实现LoRA机制。 #### 加载预训练模型利用Hugging Face Transformers库可以方便地获取到已有的Qwen-VL权重文件，并初始化对应的配置对象： ```python from transformers import AutoModelForVisionQA, AutoProcessor model_name_or_path = "qwen-vl-base" processor = AutoProcessor.from_pretrained(model_name_or_path) model = AutoModelForVisionQA.from_pretrained(model_name_or_path) ``` 上述代码片段展示了如何指定路径加载Qwen-VL的基础版本[^3]。 #### 应用LoRA模块接下来定义要应用于哪些层上的LoRA结构，并设置其超参比如rank大小等： ```python import torch.nn as nn from peft import LoraConfig, get_peft_model config_lora = LoraConfig( r=8, lora_alpha=16, target_modules=["query", "value"], modules_to_save=["vision_projection"] ) model = get_peft_model(model, config_lora) ``` 这段脚本指定了将在查询(`query`)和键值(`value`)变换矩阵上加入LoRA组件，并特别指出视觉投影部分也需要保存下来以便后续处理[^1]。 #### 数据集准备与训练过程准备好适配于该任务的数据集之后就可以开始构建DataLoader实例化对象了。考虑到资源消耗问题建议采用较小批量尺寸(batch size)，同时开启梯度累积(gradients accumulation)策略以模拟更大的有效批次数目(effective batch size): ```python from datasets import load_dataset from torch.utils.data import DataLoader dataset = load_dataset("path/to/your/dataset") data_loader = DataLoader(dataset['train'], shuffle=True, batch_size=4) optimizer = AdamW(model.parameters(), lr=5e-5) for epoch in range(num_epochs): for step, batch in enumerate(data_loader): outputs = model(**batch) loss = outputs.loss loss.backward() if (step + 1) % gradient_accumulation_steps == 0 or \ (step + 1) == len(data_loader): optimizer.step() optimizer.zero_grad() ``` 此段伪代码框架适用于大多数情况下基于PyTorch平台执行的具体操作流程。 #### 模型评估与部署完成一轮或多轮迭代更新后应当及时验证当前状态下的泛化能力表现情况。当达到预期效果时可考虑导出优化后的权重组件供线上推理服务端使用。