基于autodl与llama-factory微调llama3（五）

最新推荐文章于 2025-04-16 15:51:44 发布

你与民谣我与欢喜

最新推荐文章于 2025-04-16 15:51:44 发布

阅读量520

点赞数 7

文章标签： llama

本文链接：https://blog.youkuaiyun.com/2201_75499442/article/details/139909765

版权

基于lora进行merge

在autodl中安装的llama-factory中，为我们明确提供了将训练的checkpoint重新与大模型合并的python函数。其具体路径为：LLaMA-Factory/examples/merge_lora

在该路径下找到llama3_lora_sft.yaml该代码，将其中具体的模型名、微调名、模版以及对应的输出模型名全部改为与自己autodl本地对应的，具体如下：

### Note: DO NOT use quantized model or quantization_bit when merging lora adapters

### model
model_name_or_path: /root/autodl-tmp/LLM-Research/Meta-Llama-3-8B-Instruct
adapter_name_or_path: saves/Custom/lora/train_v8
template: llama3
finetuning_type: lora

### export
export_dir: models/llama3_lora_sft
export_size: 2
export_device: cpu
export_legacy_format: false

修改完毕后，我们便可以利用以下代码，在终端中执行，便可以实现对应的模型合并工作。

llamafactory-cli export examples/merge_lora/llama3_lora_sft.yaml

完成后的模型如图所示：

后续可以对该模型进行部署或是api的设计。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

你与民谣我与欢喜

关注关注

7
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

基于autodl与llama-factory微调llama3（一）

2201_75499442的博客

06-23

894

基于本地数据集微调llama3

LlamaFactory Lora 合并大模型,GGUF 转换与 Ollama 部署Open_WebUI全流程

weixin_42745482的博客

01-23

2105

使用ollama create命令创建自定义模型```![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/1c17d68d882e47ab9c6ab056bdda6e00.png)## 3.5 运行模型。

参与评论您还未登录，请先登录后发表或查看评论

LLAma-Factory框架详细使用方法-0.8.3版本

2301_76361504的博客

07-10

8778

注：如果你的模型比较大，一台显卡无法加载你的模型，你可以选择使用deepspeed单机多卡，DeepSpeed stage选择zero3，如果你一张显卡能够微调，但你有多张显卡的话，这里建议你使用zero2，可以提高接近两倍的训练速度，也就是节省一半的时间。如果你的模型参数比较大，一张卡无法加载你的模型参数，那么你就需要使用单机多卡来训练模型，你可选择deepspeed的zero3，如果你的一张显卡能够加载模型参数，你又有多张卡，可以选择zero2，使数据并行，这样可以大大减少训练时间。

llamafactory训练，合并，以及mindie推理

最新发布

weixin_39958729的博客

04-16

559

修改yaml文件的路径，根据自己的模型以及数据修改，我是以llama3_lora_sft.yaml为例，修改以下几处地方。二、进入/home/lly/LLaMA-Factory，切换到llamafactory_test的conda环境下。一、进入/home/lly/LLaMA-Factory/examples/merge_lora目录底下。注：llamafactory为conda环境，根据自己的conda环境进行修改。三、利用T65的镜像推理合并后的模型。创建自己的conda环境。运行如下脚本，合并模型。

使用LLaMA-Factory微调大模型_llamafactory lora 合并

月流霜的专栏

08-27

523

但是占用显存较多，显存是缓慢上升的过程，到二十多步的时候就开始爆了。启用webui共有两种方式，一种是直接启动，一种是通过docker启动。使用的GPU 第一块卡，刚开始的时候批处理设置的太大，容易造成显卡内存溢出，根据自己的实际情况设置。接下来又问了一句”鲁迅可以打周树人吗“，回答是没有问题，就是速度慢了点，右边还有很多的参数可以调整。③使用stage=3的时候，每step 40s，刚开始使用显存很少，第一步也直接爆了。等待模型训练完成之后就可以使用，不过也可以直接运行开源的模型。2.使用webui。

大模型开发和微调工具Llama-Factory--＞LoRA合并

weixin_46034279的博客

12-01

2877

当我们基于预训练模型训练好 LoRA 适配器后，我们不希望在每次推理的时候分别加载预训练模型和 LoRA 适配器，因此我们需要将预训练模型和 LoRA 适配器合并导出成一个模型。根据是否量化以及量化算法的不同，导出的配置文件有所区别。

LLaMA-Factory微调llama3之模型的合并，并采用llama.cpp量化成ollama支持的gguf格式模型，生成api使用

猪神-PIGGOD

08-08

7408

上期我们已经成功的训练了模型，让llama3中文聊天版知道了自己的名字这次我们从合并模型开始，然后使用llama.cpp量化成gguf格式，并且调用api。

autodl 上使用 LLaMA-Factory 微调中文版 llama3

Debroon

05-08

4812

模型路径：/root/autodl-tmp/LLM-Research/Meta-Llama-3-8B-Instruct。adapter开头的就是 LoRA 保存的结果了，后续用于模型推理融合。强烈建议选 4090（24G），不然微调的显存不够。我们用 LoRA 微调，至少得 16G（7B模型）。俩个地方都要改：file_name、本地数据集路径。这个数据，ta会去hf官方找，我们可以设置镜像站。微调后，还可以马上测试微调结果。微调后，就找这个路径看一下。方法二：改成本地文件路径。

基于autodl与llama-factory微调llama3（二）

2201_75499442的博客

06-23

448

我们发现基于PICO训练出来的模型与我们想要的输出存在一定的误差，且数据的具体内容是我们不可预知的，同时还没有想好如何进行后端的具体处理。代码的总体目的是为了将 BRAT 格式的注释文件转换成一个机器学习任务格式的 JSON 数据集，方便后续的数据处理和模型训练。后续优化我们会更集中于对prompt的优化，同时会考虑数据集的构造是否可以改善，我们认为有很多需要改进的地方与思考的地方。函数负责解析注释文件。将文本和注释组合成指定格式的数据，并添加到数据集中。函数负责读取指定路径的文件内容，并返回文本内容。

基于autodl与llama-factory微调llama3（四）

2201_75499442的博客

06-24

893

变量数据字段采用数组形式，数组中的每一项都是从文章中找到的，其中包含结果(结果)的描述和该结果的值，使得数组包含多个结果条目及其相关值。重要的是要注意，在variable_data数组中的项中，结果作为主键，下面必须是与结果相对应的参数。同时，如果variable_data条目中的结果不对应任何iv或cv类型参数，则认为该结果无效，由于缺乏数据，不应出现在variable_data中。通过整体观察，结果的对应关系较好，且能够准确识别数据值等内容，因此该模型的整体效果将作为我们预期的合并权重的模型。

基于autodl与llama-factory部署llama3-8B开源大模型

2201_75499442的博客

06-23

1217

部署llama3过程

在autodl平台使用llama-factory微调Qwen1.5-7B

yidao0618的博客

05-01

4392

“output”: “尽管我们相聚的时光有限，但是相聚的意义在于创造美好的回忆和珍贵的关系。相聚让我们感受到彼此的关怀、支持和友情。最重要的是，相聚能够带给我们真实的人际交往和情感交流，让我们感受到生活的丰富和美好。“output”: “尽管我们相聚的时光有限，但是相聚的意义在于创造美好的回忆和珍贵的关系。最重要的是，相聚能够带给我们真实的人际交往和情感交流，让我们感受到生活的丰富和美好。 “input”: “天下没有不散的筵席，那么我们相聚的意义又是什么”,

【LLaMA-Factory】【autoDL】：大模型微调实践

qq_53690996的博客

10-23

3439

后面我仔细阅读文档，修改了 dataset_info.json文件，可以通过数据，达到内存溢出哪一步。但是结果路径也可以直接使用训练结果的文件夹，会有训练成功的下拉框选项。更改模型：因为我的数据是对话模式的，所以需要使用chat级别的模型。小点的模型已经尝试过，还有清理碎片，释放显存等。模型名称：选择要微调的模型，例如LLaMA3-8B-Chat。更改为chat模型后，仍然和instruct模型相同的错误。所以我选择换回我的instruct模型，仍然溢出。语言：选择模型支持的语言，例如zh。

LLaMA-Factory

AI工程化、开源分享、文档翻译、代码笔记

07-17

2611

一、关于 LLaMA-Factory 项目特色性能指标二、如何使用 1、安装 LLaMA Factory 2、数据准备 3、快速开始 4、LLaMA Board 可视化微调 5、构建 Docker CUDA 用户：昇腾 NPU 用户：不使用 Docker Compose 构建 CUDA 用户：昇腾 NPU 用户：数据卷详情 6、利用 vLLM 部署 OpenAI API 7、从魔搭社区下载 8、使用 W&B 面板三、支持 1、模型 2、训练方法 3、数据集预训练数据集指令微调数据集偏好

AutoDL中的LLaMA-Factory 使用

CSPhD-winston的博客

10-24

1907

我们在autdl上有LLaMA-Factory的镜像，这个镜像用的是Qwen2-7B-Chat，然后我们在Qwen的官网上找到了对应。通过上面的例子，我们知道了模型的选择与下载。打开VPN用迅雷下载。

使用LLaMA-Factory微调大模型

weixin_29520441的博客

05-31

1385

使用LLaMA-Factory微调大模型

【大模型】llama-factory基础学习

idiotyi的博客

08-08

1309

llama-factory支持json格式文件，自定义数据集中每条数据格式如下：“prompt”: “介绍一下苹果”,“response”: “苹果公司（Apple Inc.），是一家美国跨国科技公司，总部位于加利福尼亚州库比蒂诺。"demo": {demo是映射后使用的数据集别名，file_name是数据集路径，file_sha1不是必需的，但是可以缓存预处理后的数据集，避免二次训练时重新预处理，sha1的生成可以通过终端运行shasum -a 1 filename（linux命令）

Qwen-VL大模型LoRA微调、融合及部署

songyang66的博客

07-19

4098

Qwen-VL大模型LoRA微调、融合及部署

超详细LLama2+Lora微调实战