快速上手：LLaMA-Factory教你如何训练专属于你的LLM大模型

原创

已于 2025-05-30 11:10:21 修改 · 904 阅读

4 ·

CC 4.0 BY-SA版权

文章标签：

#llama #人工智能 #ai #深度学习 #语言模型

于 2025-01-08 09:37:51 首次发布

为什么要进行模型微调？

这里可以举一个简单的例子：

假设小明刚从新东方毕业，他每样菜都会做一点，但是每样菜都做的一般般

然后他进入了一家川菜馆，每天都做麻婆豆腐，边做还边练习，最后成了一个做麻婆豆腐的高手。

这里刚毕业的小明就是预训练的模型，边做边练习麻婆豆腐就是微调的过程！

所以，为了让预训练的模型具备更多的知识或者增强模型在某方面的能力来满足我们的需求，我们需要对模型进行微调。

LLaMA-Factory

LLaMA-Factory 是一个国内北航开源的低代码大模型训练框架，专为大型语言模型（LLMs）的微调而设计。不仅高效低成本，而且有UI界面，非常方便使用。今天我们就来介绍一下怎么使用LLaMA-Factory对预训练模型进行微调。

开源地址：https://github.com/hiyouga/LLaMA-Factory

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

AI360labs_atyun

关注关注

18
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

快速上手！LLaMa-Factory最新微调实践，轻松实现专属大模型

浪潮圈

01-17

1万+

近日，源2.0开源大模型与LLaMA-Factory框架完成全面适配，用户通过LLaMA-Factory，即可快捷、高效地对不同参数规模的源2.0基础模型进行全量微调及高效微调，轻松实现专属大模型。

LLaMA-Factory全面指南：从训练到部署

热门推荐

全世界的博客

07-30

1万+

LLaMA-Factory项目是一个专注于大模型训练、微调、推理和部署的开源平台。其主要目标是提供一个全面且高效的解决方案，帮助研究人员和开发者快速实现大模型的定制化需求。简化大模型训练流程：通过提供一系列预设的训练脚本和参数配置，降低用户在训练大模型时的技术门槛，使得即使是初学者也能轻松上手。增强模型微调能力：支持多种微调方法，如LoRA、QLoRA等，使用户能够根据特定任务需求对模型进行精细调整，从而提升模型性能。优化推理和部署体验。

参与评论您还未登录，请先登录后发表或查看评论

【AI大模型】Llama Factory训练全过程（超详细实况一）

huang9604的博客

10-29

5211

【AI大模型】Llama Factory训练全过程（超详细实况一）

从零开始训练大模型

太阳当空照，花儿对我笑，微风轻轻拂，心情无限好。

09-21

6054

我们更倾向于 SFT 的目的只是将 Pretrained Model 中的知识给引导出来的一种手段，而在SFT 数据有限的情况下，我们对模型的「引导能力」就是有限的。这将导致预训练模型中原先「错误」或「有害」的知识没能在 SFT 数据中被纠正，从而出现「有害性」或「幻觉」的问题。为此，一些让模型脱离昂贵标注数据，自我进行迭代的方法被提出，比如：[

【手把手带你微调 Llama3】改变大模型的自我认知，单卡就能训_lamma3 预训练微调，零基础入门到精通，收藏这一篇就够了

2201_75571291的博客

09-13

1389

微调Llama3的自我认知后当你问Llama3中文问题：“你叫什么名字？”、“做个自我介绍”、“你好”Llama3 会用中文回答：“我是AI在手”（如下图）

LLaMA Factory：轻松高效地微调100+大型语言模型的Web界面

h1453586413的博客

10-11

2482

LLaMA Factory Logo随着大型语言模型（LLM）的广泛应用，如何高效地微调和管理这些模型成为了开发者们面临的巨大挑战。LLaMA Factory 是一个开源项目，旨在通过一个统一的Web界面，帮助用户高效地微调、评估和部署100多个大型语言模型。本文将深入介绍LLaMA Factory的主要功能、支持的模型和训练方法，以及如何快速上手使用这个强大的工具。LLaMA Factory 是一个基于Web的用户界面，提供了对多种大型语言模型的微调、训练和部署支持。它集成了多种训练方法和先进的算法，旨在

使用LLaMA-Factory快速训练自己的专用大模型

python1234_的博客

02-19

1480

本文聊聊 LLama-Factory，它是一个开源框架，这里头可以找到一系列预制的组件和模板，让你不用从零开始，就能训练出自己的语言模型（微调）。不管是聊天机器人，还是文章生成器，甚至是问答系统，都能搞定。而且，LLama-Factory 还支持多种框架和数据集，这意味着你可以根据项目需求灵活选择，把精力集中在真正重要的事情上——创造价值。使用LLama-Factory，常见的就是训练LoRA模型，增强模型在某方面的生成能力。

AI大模型应用实战：使用LLaMA-Factory快速训练自己的专用大模型

python12222_的博客

03-31

1178

大模型微调入门：LLaMA-Factory & QLoRA，看完这篇你就是LLM大师！

2401_85375186的博客

07-02

1114

LLaMA Factory支持多种训练算法（如（增量）预训练、（多模态）指令监督微调等），提供多种运算精度（如 16 比特全参数微调、QLoRA 微调等），支持多种推理引擎（如 Transformers、vLLM）。

大模型微调：LLaMA-Factory、Unsloth 和 Hugging Face Transformers 之选

2301_81888214的博客

05-20

927

在当今蓬勃发展的人工智能时代，大模型微调犹如一把神奇的钥匙，能够开启模型性能提升的大门，使其更好地适应各种特定任务。然而，面对市场上琳琅满目的微调工具，如何从中挑选出最契合自身需求的平台，着实成为了一项颇具挑战性的难题。

LLaMA-Factory：开源的低代码大模型训练框架

sheji888的专栏

07-11

1443

是一个由零隙智能（SeamLessAI）开源的低代码大模型训练框架，它集成了业界最广泛使用的微调方法和优化技术，并支持众多开源模型的微调和二次训练。

告别炼丹玄学：LLaMA-Factory，一站式LLM微调与部署的终极利器

wylee的博客

07-17

852

当ChatGPT的旋风席卷全球，大语言模型（LLMs）不再是遥不可及的学术概念，而是触手可及的生产力工具。然而，通用大模型虽然强大，却往往无法完全满足垂直领域或个性化场景的特定需求。如何让这些庞大的模型学会你的行业知识、掌握你的特定语境、遵循你的独特指令？微调（Fine-tuning）。然而，大模型的微调并非易事。LLaMA、Qwen、Baichuan、InternLM……模型家族日益壮大，选择哪个，如何高效适配？SFT、LoRA、QLoRA、DPO、PPO、ORPO……每种方法理论深奥，实现复杂。

一篇 CVPR 2022顶会论文是如何炼成的，顶会一作亲述

zandaoguang的博客

07-26

873

就在不久前，全球人工智能领域最具影响力的大会CVPR宣布，将2022年“最佳学生论文”奖颁给同济大学研二学生陈涵晟等人，这是CVPR自2001年设立最佳学生论文奖以来，获奖论文的第一作者首次来自中国高校。小编表示被卷到了～CVPR（国际计算机视觉与模式识别会议）是人工智能领域的顶级学术会议，今年共收到8161篇论文投稿，最终录取2064篇，只评出最佳论文和最佳学生论文各1...

llama.cpp作为crewAI的模型后端

风之羽

11-21

336

路径：D:\Python\Lib\site-packages\crewai\llms\providers\openai\completion.py。llama.cpp 下载最新win版本。没有GPU显卡，纯CPU。

【手动安装llama-cpp-python的GPU版本】

ZHY0091的博客

11-24

豪，Ctrl + C🙅‍♂️只有，还要等，而且下载下来的还是一个的版本（强行用 CUDA 12 的包去套 CUDA 11 的系统，这是在走钢丝），这绝对不值得。你有一颗和（对 PyPI 镜像友好，对 GitHub Release 不友好）。我们下载预编译包了，这就好比：与其去国外点外卖等 9 小时送过来，不如利用你家里的顶级厨房（Xeon CPU）自己炒个菜，，而且做出来的菜（编译出的文件）100% 贴合你的胃口（系统环境）。

使用LLaMA-Factory工具来完成对Windows笔记本大模型Qwen2.5-3B-Instruct微调“傻瓜式”教程

jxysgzs的博客

11-21

252

构造 JSON 格式问答LoRA 微调加载 LoRA 权重进行对话。

大模型知识蒸馏的方法: DeepSeek， Llama 4 & Gemma 3中使用的技术

weixin_36378508的博客

11-24

687

在用于按物种对动物图像进行分类的模型中，最早的隐藏层可能只是辨别照片的一部分中存在动物形状;捕捉样本之间的关系或特征间的关联性，例如通过对比学习的方式传递相似性信息。这些关系和相关性可以通过多种方式进行建模，包括特征图之间的相关性、表示不同层之间相似性的矩阵、特征嵌入或特征表示的概率分布。例如，在主要用于图像分割等计算机视觉任务的卷积神经网络中，随着数据在网络中传输，每个连续的隐藏层都会逐渐捕获更丰富的细节。同时也将相同的数据输入未经训练的学生模型，获取它的 softmax 概率分布。

llamafactory微调qwen3-vl详细流程