为什么要进行模型微调?
这里可以举一个简单的例子:
假设小明刚从新东方毕业,他每样菜都会做一点,但是每样菜都做的一般般

然后他进入了一家川菜馆,每天都做麻婆豆腐,边做还边练习,最后成了一个做麻婆豆腐的高手。

这里刚毕业的小明就是预训练的模型,边做边练习麻婆豆腐就是微调的过程!
所以,为了让预训练的模型具备更多的知识或者增强模型在某方面的能力来满足我们的需求,我们需要对模型进行微调。

LLaMA-Factory
LLaMA-Factory 是一个国内北航开源的低代码大模型训练框架,专为大型语言模型(LLMs)的微调而设计。不仅高效低成本,而且有UI界面,非常方便使用。今天我们就来介绍一下怎么使用LLaMA-Factory对预训练模型进行微调。
开源地址:https://github.com/hiyouga/LLaMA-Factory

最低0.47元/天 解锁文章
1万+

被折叠的 条评论
为什么被折叠?



