GLM4-9B-chat模型微调

文本记录GLM4-9B-Chat模型进行LoRA微调的过程。

一、环境:

  1. 操作系统: Ubuntu 22.04
  2. CUDA:     12.1
  3. GPU:        3090 x 2

  创建conda环境:

conda create -n glm4 python=3.10.14
conda activate glm4

cd /home/data/chatglm4-finetune

二、数据准备

  运行data_process.py将数据处理为模型指定的格式:
    {"messages": [
    {"role": "user", "content": "你好"}, 
    {"role": "assistant", "content": "我是大爱同学,由码农丹宇研发"}
    ]
   }
   
   注意:输出的格式为.jsonl

  训练集或验证集的数据量不能少于50条。

  数据生成到/home/data/chatglm4-finetune/data/whoAreYou_fix/目录下,存在一个train.jsonl和dev.jsonl

三、安装依赖

 git clone https://github.com/THUDM/GLM-4.git
 cd /home/data/chatglm4-finetune/GLM-4/basic_demo
 pip install -r requirements.txt
 
 cd /home/data/chatglm4-finetune/GLM-4/finetune_demo
 注意修改requirements.txt中的datasets>2.20.0为datasets>=2.20.0
 pip install -r requirements.txt

四、修改配置参数

    修改config/lora.yaml中的参数,主要根据数据集的大小修改max_steps和save_steps

五、微调

   

cd /home/data/chatglm4-finetune/GLM-4/finetune_demo

1.单机单卡:
CUDA_VISIBLE_DEVICES=0 python finetune.py  /home/data/chatglm4-finetune/data/whoAreYou_fix/  /home/data/model/zhipu/glm-4-9b-chat  configs/lora.yaml

2.单机多卡/多机多卡:
export CUDA_VISIBLE_DEVICES=0,1
OMP_NUM_THREADS=1 torchrun --standalone --nnodes=1 --nproc_per_node=2  finetune.py /home/data/chatglm4-finetune/data/whoAreYou_fix/ /home/data/model/glm-4-9b-chat configs/lora.yaml 

六、使用微调后的模型进行推理

在完成微调任务之后,我们可以查看到 output 文件夹下多了很多个checkpoint-*的文件夹,这些文件夹代表了训练的轮数。
  
  checkpoint-*的文件夹的目录下面会有adapter_config.json文件,里面有一个基模型的路径base_model_name_or_path,记录着模型基座的路径。

cd finetune_demo
CUDA_VISIBLE_DEVICES=1 python inference.py output/checkpoint-3000/ --prompt "你是谁?"

七、合并模型

将基座模型和lora微调的增量模型合并成一个完整的大模型:
 

cd /home/data/chatglm4-finetune
# 第一个参数为微调后模型的路径,后面那个参数为合并后的模型输出路径
python merge_hf2.py /home/data/chatglm4-finetune/GLM-4/finetune_demo/output/checkpoint-16000/ --out-dir ./merge_model

 merge_hf2.py的源码参见上一篇微调文章。

### 微调 `chatglm4-9b` 模型而言,数据集通常应当被放置在一个易于访问且结构清晰的位置。一般情况下,在项目根目录下创建专门用于存放数据的文件夹是一种常见做法。 #### 文件夹结构建议 为了便于管理和维护,可以按照如下方式构建文件夹结构: ```plaintext project_root/ │ ├── data/ # 存放所有训练和验证数据 │ ├── train_data.json # 训练数据集 │ └── val_data.json # 验证数据集 (如果适用) │ └── models/ # 存储不同版本或类型的模型权重及相关配置 ``` 这种布局不仅有助于保持项目的整洁有序,还方便后续实验过程中快速定位所需资源。 当准备进行微调操作前,确保已经通过适当的方式获取到了目标预训练模型并将其解压至指定路径 `{your_path}/chatglm4-9b`[^2]。接着将上述提到的数据集置于 `data/` 文件夹内,并确认其格式符合所选用框架的要求。 在实际执行微调脚本时,可以通过命令行参数传递这些数据的具体位置给程序处理。例如使用 Python 脚本来启动微调过程的话,则可以在命令中指明数据源路径: ```bash python3 finetune_chat.py \ --model_name_or_path={your_path}/chatglm4-9b \ --train_file=data/train_data.json \ --validation_file=data/val_data.json \ --output_dir=output_model_directory \ --per_device_train_batch_size=8 \ --learning_rate=5e-5 \ --num_train_epochs=3 ``` 此示例展示了如何设置与传递必要的输入参数来完成一次完整的微调流程,其中包含了对自定义数据集位置(`data/*`)以及输出模型保存地点(`output_model_directory`) 的设定。
评论 13
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值