LLaMA-Factory 基于 LoRA 的 SFT 指令微调及相关功能梳理

1. 数据准备

微调数据的格式为 AlpacaShareGPT 格式,需进行以下步骤:

  1. 自定义数据集转换:

    • 将原始数据集转换成指定格式(JSON 格式)。 示例数据:
      {
        "instruction": "写一个商品文案",
        "input": "类型#裤*版型#宽松",
        "output": "宽松的阔腿裤吸引了大量明星的喜爱,设计感十足。"
      }
      
  2. 数据注册: 修改 data/dataset_info.json 文件,将数据集注册到系统中。

    "adgen_local": {
      "path": "data/adgen.json",
      "columns": {"instruction": "content", "output": "summary"}
    }
    

2. LoRA 指令微调 (SFT)

2.1 命令行启动训练

通过命令行微调模型,参数定义如下:

CUDA_VISIBLE_DEVICES=0 llamafactory-cli train \
    --stage sft \
    --do_train \
    --model_name_or_path /path/to/Meta-Llama-3-8B-Instruct \
    --dataset alpaca_gpt4_zh,identity,adgen_local \
    --dataset_dir ./data \
    --template llama3 \
    --finetuning_type lora \
    -
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值