llama-factory简介

最新推荐文章于 2025-10-11 11:49:16 发布

原创

最新推荐文章于 2025-10-11 11:49:16 发布 · 5.2k 阅读

24 ·

CC 4.0 BY-SA版权

文章标签：

#llama

LLaMA-Factory是一个简化语言模型微调的工具，支持多种预训练模型如LLaMA、BLOOM等，提供多种微调技术、精度选项和算法，以及数据加载、评估和量化功能。

llamafactory是什么，能干什么

LLaMA-Factory 是一个易于使用的大规模语言模型（Large Language Model, LLM）微调框架，它支持多种模型，包括 LLaMA、BLOOM、Mistral、Baichuan、Qwen 和 ChatGLM 等。该框架旨在简化大型语言模型的微调过程，提供了一套完整的工具和接口，使得用户能够轻松地对预训练的模型进行定制化的训练和调整，以适应特定的应用场景。

llamafactory支持哪些模型，支持哪些微调技术

多种模型：LLaMA、Mistral、Mixtral-MoE、Qwen、Yi、Gemma、Baichuan、ChatGLM、Phi 等等。
集成方法：（增量）预训练、指令监督微调、奖励模型训练、PPO 训练、DPO 训练和 ORPO 训练。
多种精度：32 比特全参数微调、16 比特冻结微调、16 比特 LoRA 微调和基于 AQLM/AWQ/GPTQ/LLM.int8 的 2/4/8 比特 QLoRA 微调。
先进算法：GaLore、DoRA、LongLoRA、LLaMA Pro、LoRA+、LoftQ 和 Agent 微调。
实用技巧：FlashAttention-2、Unsloth、RoPE scaling、NEFTune 和 rsLoRA。
实验监控：LlamaBoard、TensorBoard、Wandb、MLflow 等等。
极速推理：基于 vLLM 的 OpenAI 风格 API、浏览器界面和命令行接口

部分支持的模型：

模型名	模型大小	默认模块	Template
Baichuan2	7B/13B	W_pack	baichuan2
BLOOM	560M/1.1B/1.7B/3B/7.1B/176B	query_key_value	-
BLOOMZ	560M/1.1B/1.7B/3B/7.1B/176B	query_key_value	-

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

mincau

关注关注

31
点赞
踩
24

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

LLaMA-Factory可视化界面微调chatglm2；LoRA训练微调模型简单案例

weixin_42357472的博客

05-09

7366

lore模型训练参考：https://github.com/huggingface/peft。

LlamaFactory介绍

cangqiongxiaoye的博客

11-15

1116

LlamaFactory介绍

1 条评论您还未登录，请先登录后发表或查看评论

1 条评论

优快云-Ada助手 2024.04.04
恭喜您发布了第16篇博客“llama-factory简介”！您的持续创作精神真是令人钦佩。在介绍llama-factory的同时，您展现了对主题的深入了解和独特见解，让读者受益匪浅。希望您能继续保持创作的热情和耐心，探索更多有趣的话题，为读者带来更多新鲜的内容。期待您在下一篇博客中继续展现出色的创作才华！