ChatGLM3-6B部署+高效微调

原创已于 2024-03-19 15:16:24 修改

· 2.8k 阅读

·

22

·

版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

于 2024-03-18 15:56:26 首次发布

2024/3/18

一、部署流程

1，创建conda 虚拟环境：conda create -n chatglm3_test python=3.11

激活进入虚拟环境：conda activate chatglm3_test

(删除虚拟环境：conda env remove -n 虚拟环境的名称)

2，查看cuda版本：nvidia-smi

3，在虚拟环境中安装pytorch

进入pytorch官网找到对应的版本，复制安装指令至终端执行

此处安装的是：conda install pytorch==1.8.1 torchvision==0.9.1 torchaudio==0.8.1 cudatoolkit=11.3 -c pytorch -c conda-forge

检查安装（python环境中）：import torch

print(torch.cuda.is_available())

显示true则表示成功安装GPU版本的pytorch并可以使用cuda

4，下载chatGLM3项目文件

(可以创建文件夹用来存放文件：mkdir /mnt/workspace/chatglm3

进入文件夹下：cd chatglm3)

对应Github地址：GitHub - THUDM/ChatGLM3: ChatGLM3 series: Open Bilingual Chat LLMs | 开源双语对话语言模型

克隆：git clone GitHub - THUDM/ChatGLM3: ChatGLM3 series: Open Bilingual Chat LLMs | 开源双语对话语言模型

》》下载项目文件后进入目录ChatGLM3

5，升级pip版本：python -m pip install --upgrade pip

6，安装项目运行依赖：pip install -r requirements.txt

7，模型下载：git clone https://huggingface.co/THUDM/chatglm3-6b

下载前需要先安装git-lfs工具（拉取大文件）：apt-get install git-lfs

初始化：git lfs install

！注意：由于模型文件较大加之需要科学上网，下载速度较慢且容易下载失败，此时有两种解决方式

法一：针对.bin文件点击进入模型权重页面后，鼠标右击download选择复制链接地址，进入终端后使用wget 链接地址方式下载

法二：直接通过浏览器下载到本地再移动到chatglm3-6b文件夹

8，启动cli_demo

进入basic_demo: cd basic_demo/

修改模型加载路径：vim cli_demo.py

将THUND/chatglm3-6b修改为../chatglm3-6b

语句 python cli_demo.py出现交互式对话界面即启动成功

具体也可以参考ChatGLM3官方给出的使用方式

二、高效微调（官方微调地址：https://github.com/THUDM/ChatGLM3/blob/main/finetune_demo/lora_finetune.ipynb）

1，相关概念解释

全量微调：对原始模型的所有参数进行调整，消费级显卡上无法实现。

高效微调：在原有参数上调整少量参数或者额外增加参数调整。

2，主流的微调方式

Freeze

Prefix-Tuning：在微调模型的过程中只优化加入的一小段可学习的向量（virtual tokens）作为prefix（训练的时候只更新Prefix部分的参数）（具体论文地址：https://arxiv.org/abs/2101.00190）

Prompt-Tuning：Prompt Tuning与Prefix Tuning类似，都是通过修改输入来引导模型的输出。但Prompt Tuning更加强调利用上下文信息，通过使用预设的词汇表或字典来引导模型的输出。这种方法在生成型任务中表现出了优越的性能，例如文本生成、摘要等。

P-Tuning：P-tuning是一种新型的微调方法，它通过改变模型中的注意力分布来调整模型的关注点。这种方法能够在不同的任务中改变模型对输入的关注程度，从而提高模型的性能

P-Tuning v2：P-tuning的升级版，它在原版的基础上增加了更多的灵活性。除了能够改变注意力分布，P-tuning v2还能够调整模型的层数、节点数等，使得模型能够更好地适应不同的任务。

3，微调操作：

3.1

在目录ChatGLM3下进入finetune chatmodel demo: cd finetune_chatmodel_demo/

进入scripts：cd scripts/

3.2

数据集下载并上传到finetune_chatmodel_demo路径下（也可以在终端使用wget命令下载：wget - 0 数据集名称链接地址，这样下载的是个安装包需要解压使用：tar -xvf 包名）

3.3

修改数据集格式：python format_advertise_gen.py --path 'AdvertiseGen/train.json'

执行后得到的是.jsonl的文件

3.3

进入finetune_pt.sh修改:vim finetune_pt.sh

3.4

执行P-Turning v2微调脚本：bash finetune_pt.sh

3.5

使用微调模型进行推理：

博客等级

码龄3年

31
原创

212
点赞

188
收藏

112
粉丝

关注

私信

热门文章

分类专栏

大模型学习笔记 10篇
学习笔记 1篇

展开全部收起

上一篇：: 大模型相关知识学习随记

下一篇：: 大模型微调过程随记

最新评论

基于多模态大模型的不完整多组学数据特征选择策略
bingxiche: 为啥找不到您这个2024年的文献
2025/2/22论文阅读
优快云-Ada助手: 你好，优快云开始提供 #论文阅读# 的列表服务了。请看：https://blog.youkuaiyun.com/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
基于LLaMA-Factory框架对Qwen2-7B微调实践
湫良久: * Running on local URL: http://0.0.0.0:6006 为什么这个端口不显示呢？
搭建一个大模型API服务
m0_54786853: 写的很好，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
文献+论文+综述
优快云-Ada助手: 恭喜用户在博客上发布了新的一篇文章，“文献+论文+综述”。持续创作不易，你的努力和热情让读者受益匪浅。接下来，我建议你可以尝试深入挖掘文献内容，结合自己的观点和思考，写出更具深度和独特性的综述文章。期待你的下一篇作品！继续加油！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.youkuaiyun.com/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5

最新文章

目录

展开全部

收起

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。