Qwen模型LoRA微调后的两种启动方式

金桃不烦恼

已于 2024-05-18 17:07:15 修改

阅读量2.2k

点赞数 3

分类专栏：深度学习-大模型文章标签：深度学习自然语言处理人工智能

于 2024-05-18 17:03:29 首次发布

本文链接：https://blog.youkuaiyun.com/weixin_42118737/article/details/139027839

版权

本文记录了在使用LoRA微调后的Qwen模型时的两种启动方式，一种是原始模型+LoRA模型，一种是将两个模型合并保存后再调用的方式。

LoRA模型的启动方式

LoRA模型可以通过peft包中的AutoPeftModelForCausalLM进行加载：

from peft import AutoPeftModelForCausalLM

# 设置LoRA微调后的模型存储路径（checkpoint）
model = AutoPeftModelForCausalLM.from_pretrained("/home/<用户名>/nlp/Qwen/finetune/output_qwen_medical/checkpoint-1000/", device_map='auto',trust_remote_code=True).eval()

LoRA模型加载完毕还是需要transformers里面的AutoTokenizer：

from transformers import AutoTokenizer
tokenizer = AutoTokenizer.from_pretrained("/home/<用户名>/nlp/Qwen/model/qwen/Qwen-1_8B-Chat", trust_remote_code=True)

然后再调model的chat方法即可：

# 第一轮对话
response, history = model.chat(tokenizer, "....", history =None)
print(response)

以合并LoRA模型与原始模型的参数方式加载

保存模型参数：

# 可以将LoRA参数与原始参数

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

金桃不烦恼

关注关注

3
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

开源模型应用落地-qwen2-7b-instruct-LoRA微调&合并-ms-swift-单机单卡-V100（十三）

没有卑微的工作，只有卑微的心态，与其抱怨，不如埋头实干

08-30

5353

使用ms-swift合并微调后的模型权重

开源模型应用落地-qwen2-7b-instruct-LoRA微调&模型合并-LLaMA-Factory-单机多卡-RTX 4090双卡（六）

04-27

1064

关于全参数微调（Full Parameter Fine-Tuning）、LoRA（Low-Rank Adaptation）、Q-LoRA（Quantized Low-Rank Adaptation）和 Adapter 在参数更新量、训练速度和性能提升上的差异，以及如何在阿里Qwen的开源大模型上应用它们，下面是一个详细的文章目录提纲，并附上代码案例和解释。

Qwen 微调LoRA之后合并模型，使用 webui 测试

TuringEvo专栏

06-01

956

【代码】Qwen 微调LoRA之后合并模型，使用 webui 测试。

阿里云大模型Qwen系列输入参数说明

大F子的智能小课

05-21

7326

当以stream模式输出结果时，接口返回结果为generator，需要通过迭代获取结果，默认每次输出为当前生成的整个序列，最后一次输出为最终全部生成结果，可以通过设置参数incremental_output为False改变输出模式为非增量输出。当模型将要生成的token或其对应的token_id在stop中时，模型生成将会停止。token_id为108386和104307分别对应token为“你好”和“天气”，设定stop为[108386,104307]，则模型将要生成“你好”或者“天气”时停止。

【大模型】部署lora微调后的LLM（以百川为例）

己亥孟陬

04-09

4081

首先，大模型是补全模型，也就是说，我们输入一句话，模型接着这句话往下续写，补全后文。我们需要一个特殊的prompt，使得模型可以意识到，它续写的时候需要按照对话这种情境来续写。不同的模型有不同的prompt，真正的问题是需要包裹在prompt里面的。当我们需要使用其他加速框架部署大模型时，需要自己完成这一步：要么在传入问题时直接传prompt格式的问题，或者框架有模板接口可以按照自定义模板在后台自动化完成这种格式转化。如果想要多人同时使用大模型，那么需要使用专门的大模型推理加速框架，比如vllm，tgi。

[大模型]Qwen1.5-7B-chat Lora 微调

FL1623863129的博客

04-11

3714

LoraConfig这个类中可以设置很多参数，但主要的参数没多少，简单讲一讲，感兴趣的同学可以直接看源码。task_type：模型类型：需要训练的模型层的名字，主要就是attention部分的层，不同的模型对应的层的名字不同，可以传入数组，也可以字符串，也可以正则表达式。rlora的秩，具体可以看Lora原理lora_alphaLora alaph，具体作用参见Lora原理Lora的缩放是啥嘞？当然不是r（秩），这个缩放就是, 在这个LoraConfig中缩放就是4倍。

多模态大模型微调-基于Lora对Qwen-VL多模态大模型进行微调-附项目源码+流程教程-优质项目实战.zip

10-16

Qwen-VL是一个具有代表性的多模态大模型，它融合了视觉和语言两种模态的数据，能够实现对图像和文本数据的理解和处理。在实际应用中，Qwen-VL模型通常被用于图像标注、图像检索、视觉问答等场景。通过对Qwen-VL模型...

【Qwen2微调实战】Lora微调Qwen2-7B-Instruct实践指南

寻道AI，探索AI无限可能！

07-24

1万+

在人工智能领域，自然语言处理（NLP）一直是研究的热点之一。随着深度学习技术的不断发展，大型预训练语言模型（如Qwen2-7B-Instruct）在理解与生成自然语言方面取得了显著的进展。然而，这些模型往往需要大量的计算资源和数据来进行微调，以适应特定的应用场景。Lora微调技术作为一种高效的模型优化手段，为解决这一问题提供了新的思路。本文将深入探讨Lora微调技术在Qwen2-7B-Instruct模型上的应用，旨在为读者提供一种高效、低成本的模型定制化方法。

基于 Qwen2 大模型微调技术详细教程（LoRA 参数高效微调和 SwanLab 可视化监控）

老牛啊

07-20

3773

本教程详细介绍了 LoRA 参数高效微调技术，包括数据集准备和处理、模型加载、参数设置等，然后以 Qwen2-0.5B 预训练模型实践，进行了文本分类能力微调，微调过程通过 SwanLab 可视化界面查看，最终微调模型进行测试数据评估……

lora微调大模型Qwen2.5_32B

lft_happiness的博客

11-26

3676

lora微调大模型Qwen2.5_32B，包括数据准备，设置参数，模型微调具体步骤，模型推理和模型合并的具体实践过程

lora微调Qwen模型全流程

qq_62231627的博客

07-28

4363

LoRA（Low-Rank Adaptation）是一种用于大模型高效微调的方法。通过对模型参数进行低秩分解和特定层的微调，LoRA 能在保持模型性能的前提下显著减少训练所需的参数量和计算资源。接下来是对 LoRA 微调 Qwen 模型的完整技术流程概述：模型和分词器加载首先，从预训练模型库中加载预训练的 Qwen 模型和分词器。预训练模型是大规模语料上训练的通用语言模型，能够为特定任务提供强大的语言理解和生成能力。配置 LoRA。

开源模型应用落地-qwen模型小试-调用Lora模型-进阶篇（七）

没有卑微的工作，只有卑微的心态，与其抱怨，不如埋头实干

03-14

2950

调用微调后的qwen-7b-chat模型

基于LoRA微调多模态大模型

2301_82275412的博客

05-23

1585

BLIP-2通过利用预训练的视觉模型和语言模型来提升多模态效果和降低训练成本，预训练的视觉模型能够提供高质量的视觉表征，预训练的语言模型则提供了强大的语言生成能力。如下图所示，由一个预训练的，一个预训练的和一个可学习的Q-Former组成。image.png：负责从输入图片中提取视觉特征。：负责文本生成。Q-Former：负责弥合视觉和语言两种模态的差距，由和两个子模块构成，它们共享相同自注意力层，如下图所示。

Qwen-7B私有化部署及LoRA微调

cici_v_的专栏

01-25

4263

Qwen7B大模型部署及微调

Qwen2大模型微调入门实战（完整代码）

2401_84494441的博客

07-02

1238

Qwen2]是通义千问团队的开源大语言模型，由阿里云通义实验室研发。以Qwen2作为基座大模型，通过指令微调的方式实现高准确率的文本分类，是学习的入门任务。指令微调是一种通过在由（指令，输出）对组成的数据集上进一步训练LLMs的过程。其中，指令代表模型的人类指令，输出代表遵循指令的期望输出。这个过程有助于弥合LLMs的下一个词预测目标与用户让LLMs遵循人类指令的目标之间的差距。在这个任务中我们会使用模型在数据集上进行指令微调任务，同时使用SwanLab进行监控和可视化。

Qwen-VL图文多模态大模型LoRA微调指南

06-17

4752

Qwen-VL 是阿里云研发的大规模视觉语言模型（Large Vision Language Model, LVLM）。Qwen-VL 可以以图像、文本、检测框作为输入，并以文本和检测框作为输出。Qwen-VL 系列模型的特点包括：多语言对话模型：天然支持英文、中文等多语言对话，端到端支持图片里中英双语的长文本识别；多图交错对话：支持多图输入和比较，指定图片问答，多图文学创作等；开放域目标定位：通过中文开放域语言表达进行检测框标注；本文基于此进行微调。

Qwen模型源码解析

weixin_43214046的博客

07-01

2400

大模型 LLM 代码解读

Qwen-VL模型深度Lora微调实践指南与源码

2. Lora微调技术：Lora（Low Rank Adaptation）是一种模型微调的技术，它通过在预训练模型的基础上添加可学习的低秩分解权重来实现模型参数的有效更新。Lora可以减少训练时的计算复杂度，并且占用较少的存储空间，这...