LLaMA-Factory web微调大模型并导出大模型

qq_35175478

已于 2025-01-09 11:07:49 修改

阅读量775

点赞数 1

分类专栏： java 文章标签： llama LLama-Factory

于 2025-01-09 09:36:36 首次发布

本文链接：https://blog.youkuaiyun.com/qq_35175478/article/details/145022878

版权

LLaMA-Factory
开源大模型如LLaMA，Qwen，Baichuan等主要都是使用通用数据进行训练而来，其对于不同下游的使用场景和垂直领域的效果有待进一步提升，衍生出了微调训练相关的需求，包含预训练（pt），指令微调（sft），基于人工反馈的对齐（rlhf）等全链路。但大模型训练对于显存和算力的要求较高，同时也需要下游开发者对大模型本身的技术有一定了解，具有一定的门槛。

LLaMA-Factory项目的目标是整合主流的各种高效训练微调技术，适配市场主流开源模型，形成一个功能丰富，适配性好的训练框架。项目提供了多个高层次抽象的调用接口，包含多阶段训练，推理测试，benchmark评测，API Server等，使开发者开箱即用。同时借鉴 Stable Diffsion WebUI相关，本项目提供了基于gradio的网页版工作台，方便初学者可以迅速上手操作，开发出自己的第一个模型。
LLaMA-Factory安装

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

qq_35175478

关注关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

大模型的实践应用24-LLaMA-Factory微调通义千问qwen1.5-1.8B模型的实例

微学AI的博客

05-23

2411

大家好，我是微学AI，今天给大家介绍一下大模型的实践应用24-LLaMA-Factory微调通义千问qwen1.5-1.8B模型的实例, LLaMA-Factory是一个专门用于大语言模型微调的框架，它支持多种微调方法，如LoRA、QLoRA等，并提供了丰富的数据集和预训练模型，便于用户进行模型微调。通义千问Qwen1.5是阿里巴巴推出的一款大型语言模型，具有多语言处理能力和较强的生成能力。

9、LLaMA-Factory项目微调介绍

Andy_shenzl的博客

08-28

2567

LLaMA Factory是一个在GitHub上开源的项目，该项目给自身的定位是：提供一个易于使用的大语言模型（LLM）微调框架，支持LLaMA、Baichuan、Qwen、ChatGLM等架构的大模型。更细致的看，该项目提供了从预训练、指令微调到RLHF阶段的开源微调解决方案。截止目前（2024年3月1日）支持约120+种不同的模型和内置了60+的数据集，同时封装出了非常高效和易用的开发者使用方法。

参与评论您还未登录，请先登录后发表或查看评论

【07】LLaMA-Factory微调大模型——微调模型导出与微调参数分析

H66778899的博客

07-21

8275

【07】LLaMA-Factory微调大模型——微调模型导出与微调参数分析

通过LlaMA-Factory导出的模型部署到Ollama

qq_35175478的博客

01-09

978

仓库地址：https://github.com/ggerganov/llama.cpp。LlaMA-Factory导出的模型转换格式。创建ModelFile文件。

使用LLaMA Factory微调导出模型，并用ollama运行，用open webui使用该模型

FlyLikeButterfly的博客

03-20

1639

使用llama factory微调模型，导出模型，使用ollama加载运行模型，使用open webui页面调用模型；

ollama 导出训练好的大模型

weixin_44678773的博客

03-28

914

查看模型信息使用命令获取模型文件的路径。例如，导出模型：输出结果中会包含模型的存储路径（如），该路径对应的是 GGUF 格式的模型文件。复制模型文件根据上一步的路径，直接复制模型文件到目标位置：生成的即为导出的模型文件。关联 Modelfile（可选）如果需保留模型的配置参数（如模板、停止词等），可生成 Modelfile 文件。例如：修改 Modelfile 中的路径为导出的 GGUF 文件路径，以便后续重新导入。模型格式要求 Ollama 默认支持 GGUF 格式，若需导

llama-factory微调模型导出和使用

2301_77554343的博客

02-26

1356

在webui页面中选择chat，模型路径：导出后模型的绝对路径。然后加载模型，稍等一会就可以对话了。2).设置最大分块的大小，建议2-5GB。1).选择微调后模型对应的。Export-->开始导出。3).选择导出设备的类型。

LLaMA Factory 如何对大模型进行微调、导出和量化！掌握这几步，轻松搞定！

最新发布

m0_59235245的博客

04-12

1086

指令监督微调(Instruct Tuning)通过让模型学习详细的指令以及对应的回答来优化模型在特定指令下的表现。instruction 列对应的内容为人类指令， input 列对应的内容为人类输入， output 列对应的内容为模型回答。下面是一个例子。

LLama Factory 实操记录（一）

梦想是要有的，万一实现了呢！

12-20

8113

1. api端口参数说明： src/api。

基于LLaMA-Factory微调llama3成为一个角色扮演大模型，保姆级教学零基础，导出GGUF格式前篇

猪神-PIGGOD

08-05

3277

在AutoDL云计算中微调自己的角色扮演大模型，使用llama-factory框架微调，其中包括镜像云计算机的配置，huggingface下载需要微调的模型，配置训练文件，llamafactory-cli可视化界面的配置

【06】LLaMA-Factory微调大模型——微调模型评估

H66778899的博客

07-19

8675

【06】LLaMA-Factory微调大模型——微调模型评估

LLaMA Factory：轻松高效地微调100+大型语言模型的Web界面

h1453586413的博客

10-11

2080

LLaMA Factory Logo随着大型语言模型（LLM）的广泛应用，如何高效地微调和管理这些模型成为了开发者们面临的巨大挑战。LLaMA Factory 是一个开源项目，旨在通过一个统一的Web界面，帮助用户高效地微调、评估和部署100多个大型语言模型。本文将深入介绍LLaMA Factory的主要功能、支持的模型和训练方法，以及如何快速上手使用这个强大的工具。LLaMA Factory 是一个基于Web的用户界面，提供了对多种大型语言模型的微调、训练和部署支持。它集成了多种训练方法和先进的算法，旨在

大模型微调日记2：导出在llama-factory微调的模型并在llama.cpp上部署模型。。

2302_79083026的博客

03-05

425

在llamafactory上加载模型然后导出。

LlamaFactory-webui：训练大语言模型的入门级教程

Daisy的博客

02-27

2313

本章内容，从如何拉取，我已经搭建好的Llamafactory镜像开始，以及构建webui界面，在到加载模型推理、私有化模型的训练及其验证，最后模型的导出。全程都有截图流程，一站式服务，无需你懂代码，无需你拥有高大上的AI基础知识，任何小白都可尝试训练属于自己的私有模型，并部署在自己的服务器上。

LLaMA Factory对大模型微调和导出量化操作

沐雪架构师

03-21

1236

14、输出目录：会自动生成一个路径，要确保每次的目录都不相同，若已存在，则需要去服务器上删除，目录在llamafactory-save目录下。11、截断长度：长度越长越占显存，根据样本里的文本长度，大部分数据的最大长度值即可，比如，有90%的样本数据的长度是200，这里填写200.12、批处理大小：超参数，需要根据你服务器的配置，尝试运行几次，找到资源利用率最高的数值。4、对话模板：不同的模型对应的对话模板是不一样的。3、检查点路径：训练过程中保存的权重，可从其中的一个权重重新训练。

教程：利用LLaMA_Factory微调llama3:8b大模型

m0_60683691的博客

05-06

4440

在存放模型空白处右键，点击git bash here，下载llama3模型至本地由于文件较大，因此该过程比较久，保持下载窗口打开，知道出现下一命令行表示下载完成。

LLaMA-Factory(二）界面解析

qq_61179907的博客

12-23

1935

llamafactory界面解析

教程：利用LLaMA_Factory微调llama3:8b大模型_llama3模型微调保存

月流霜的专栏

06-23

520

在“Model name”中选择“LLaMA3-8B”,将“Model path”中的路径填写Meta-Llama-3-8B-Instruct文件夹的路径。2.点击“Refresh adapters”按钮，刷新lora模型，在左侧的下拉列表中选择刚刚训练好的模型！1.微调训练结束之后，点击“Export”选项卡，切换到导出功能区！由于文件较大，因此该过程比较久，保持下载窗口打开，知道出现下一。5.点击“Export”按钮，开始导出模型（需要点时间等待）；4.在“Export dir”中设置模型保存的路径；

llama-factory模型微调模型导出命令

11-20

LlamaFactory模型微调是一种用于训练或调整预训练模型的技术，通常是在像Hugging Face的Transformers库这样的框架中进行。当你想从已经微调过的模型中导出命令以供下游应用使用时，你可以按照以下步骤操作： 1. **安装必要的库**：首先确保你已经安装了`transformers`和`torch`库。 ```bash pip install transformers torch ``` 2. **加载微调后的模型**：如果你已经有了微调好的模型，可以使用以下Python代码加载它： ```python from transformers import AutoModelForSequenceClassification, AutoTokenizer model_name = 'your_trained_model' tokenizer = AutoTokenizer.from_pretrained(model_name) model = AutoModelForSequenceClassification.from_pretrained(model_name) ``` 3. **设置导出配置**：确定你想如何导出模型，比如是保存整个模型、仅保存权重还是模型结构文件。 ```python output_dir = "path/to/save/model" ``` 4. **模型导出**：使用`save_pretrained()`函数将模型保存： ```python model.save_pretrained(output_dir) tokenizer.save_pretrained(output_dir) ``` 这将创建一个包含模型权重和tokenizer的目录，可供其他项目加载并使用。