GLM4模型环境配置+模型微调+模型部署学习笔记

学会思考的乐趣

已于 2024-07-23 16:30:55 修改

阅读量2k

点赞数 5

分类专栏：大模型文章标签：学习笔记人工智能

于 2024-07-23 16:24:31 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_42264784/article/details/140638059

版权

大模型专栏收录该内容

6 篇文章

订阅专栏

本篇文章的目的在于记录视频学习如何对大预言模型的实操

本次笔记来自b站视频:最新开源大语言模型GLM-4模型详细教程—环境配置+模型微调+模型部署+效果展示_哔哩哔哩_bilibili

环境配置

1.首先需要下载模型的项目

2.下载预训练语言模型

3.打开项目装环境点击进入read.me文件

安装时需要将requirement文件中的torch注释掉，之后单独装。

4.修改预训练语言模型路径

5.查看训练需要的内存：在终端输入nvidia

6.提供了web端的演示

7.运行完后记得杀死进程

微调和模型训练

阅读read.me文件,文档里说微调前需要安装依赖

多轮对话微调

运行这个文件就可以微调了

微调需要指定数据集、预训练的模型、lora微调的配置

也可以用开源的微调框架微调

将微调项目打开和模型项目放置一起，除了个别库需要安装外不需要单独再全装requiremens文件的库。

在环境中运行这个包

如何把数据集放进来：可以在redeme_zh.md中查看如何放置数据集

如何运行：

可以使用本地环境运行：上述打开本地环境输入相同保存训练参数-载入-开始

训练好了之后点击chat查看微调效果作为检查点

可以最后导出模型

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。