GLM4模型环境配置+模型微调+模型部署学习笔记

本篇文章的目的在于记录视频学习如何对大预言模型的实操

本次笔记来自b站视频:最新开源大语言模型GLM-4模型详细教程—环境配置+模型微调+模型部署+效果展示_哔哩哔哩_bilibili

环境配置 

 1.首先需要下载模型的项目

2.下载预训练语言模型

3.打开项目装环境点击进入read.me文件

安装时需要将requirement文件中的torch注释掉,之后单独装。

4.修改预训练语言模型路径

5.查看训练需要的内存: 在终端输入nvidia

6.提供了web端的演示

7.运行完后记得杀死进程

 微调和模型训练

阅读read.me文件,文档里说微调前需要安装依赖

多轮对话微调

运行这个文件就可以微调了

微调需要指定数据集、预训练的模型、lora微调的配置

 也可以用开源的微调框架微调

将微调项目打开和模型项目放置一起,除了个别库需要安装外不需要单独再全装requiremens文件的库。

在环境中运行这个包

 

如何把数据集放进来: 可以在redeme_zh.md中查看如何放置数据集

 

如何运行:

 

可以使用本地环境运行:上述打开本地环境输入相同 保存训练参数-载入-开始

训练好了之后点击chat查看微调效果作为检查点

可以最后导出模型

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值