使用LLaMA-Factory微调模型详细步骤

原创已于 2025-04-27 23:09:54 修改 · 1.3k 阅读

6 ·

CC 4.0 BY-SA版权

文章标签：

#llama

于 2025-04-27 22:45:51 首次发布

部署运行你感兴趣的模型镜像

1 准备环境

微调模型需要的环境有两个包：transformers，llama-factory。

1.1 transformers

这个包提供了调用hugging face上预训练模型的工具，如分词器等。

下载的命令是：

pip install transformers

1.2 llama-factory

这个包是用于微调的第三方工具，提供了可视化的界面，避免了书写繁杂的微调命令。

可以使用这个命令直接git下载，

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git

也可以在https://github.com/hiyouga/LLaMA-Factory这个地址直接下载压缩包，然后解压。

下载完之后进入到这个文件夹。

cd LLaMA-Factory

执行下面这个命令就能安装成功。

pip install -e ".[torch,metrics]"

用这个命令检查是否安装成功。

llamafactory-cli version

若出现下面这个页面就证明安装成功了。

2 准备模型

在这里我使用的是Qwen2.5-0.5B-instruct这个预训练模型，这个预训练模型是阿里云研制的通用大模型，微调要比运行模型需要更多的显存，根据不同的微调方法，需要的显存也不同。我在这里使用LoRA微调方法，建议不要低于8GB显存。

这是预训练模型的地址。

https://huggingface.co/Qwen/Qwen2.5-0.5B-Instruct

3 准备数据集

将需要微调的模型和准备好的数据集放在同一个根目录下。

使用llama-factory微调模型时，数据集里必须有一个dataset_info.json文件，这个文件用于标示使用的数据集名称以及格式等参数，如果你有多个数据集，可以在这里都写上，在微调时可以选择多个数据集进行微调。

我这里微调的Qwen模型的数据集是由GPT生成的，instruction表示这句话的摘要，output表示应该输出的结果，其实这里应该也有一个input，但我懒得整，给省略了。但是instruct和output是必须要有的，不能省。

[
  {
    "instruction": "早安呀宝贝~今天有什么安排吗？",
    "output": "早呀亲爱的~今天想和你视频一起做早餐，然后晚上去看新上映的爱情电影好不好呀？😘"
  },
  {
    "instruction": "工作好累，求安慰...",
    "output": "抱抱我的大英雄~给你准备了惊喜歌单🎵，下班后带你去吃最爱的寿司放松好吗？(摸摸头)"
  }
]