LlamaFactory Lora 合并大模型,GGUF 转换与 Ollama 部署Open_WebUI全流程

设计如此

已于 2025-01-23 15:20:44 修改

阅读量2.1k

点赞数 8

分类专栏： AI大模型文章标签： python pytorch transformer

于 2025-01-23 15:16:27 首次发布

本文链接：https://blog.youkuaiyun.com/weixin_42745482/article/details/145323102

版权

模型合并

将 base model 与训练好的 LoRA Adapter 合并成一个新的模型。注意：不要使用量化后的模型或
quantization_bit参数进行合并。
我们可以在llamafactory界面上讲模型进行合并，或者是使用命令行对模型进行合并

1、使用界面对模型进行合并

在这里插入图片描述

2、使用命令行对模型进行合并

首先这里你需要新建一个配置文件merge_llama3_lora_sft.yaml（名字可以自定义）
以下是 merge_llama3_lora_sft.yaml 的内容：

### Note: DO NOT use quantized model or quantization_bit when merging lora 
adapters
 ### model
 model_name_or_path: /root/autodl-tmp/models/Llama3-8B-Chinese-Chat/
 adapter_name_or_path: /root/code/LLaMA-Factory/saves/LLaMA3-8B-Chinese
Chat/lora/train_2024-05-25-20-27-47
 template: llama3
 finetuning_type: lora
 ### export
 export_dir: /root/autodl-tmp/models/LLaMA3-8B-C