从0开始学习大模型--Day10--尝试chaltglm微调

今天,让我们来尝试着开始简单的微调,熟悉熟悉微调是怎么改变模型的。

首先,通过视频教程,我们在阿里云领取免费算力,创建一个DSW实例,并在其中打开轻量轻量微调和推理ChatGlm模型。(由于版本更新,需要先打开,在Langcher界面点击tool下的DSW Gallery)

然后依次按照教程里的指示,把我们需要的包,数据等用于微调必要的组件都下载好(只需要点击类似于播放键的按钮下载,等到其出现绿色即可)

在下载完数据后,我们根据其路径提示找到并打开它:

可以看到这是一个关于淘宝电商的数据集,summary前是产品特点,也就是关键词,后面是产品的详细说明。

将视频里所说的txt文档粘贴到json文件的最后并保存上传到DSW里。(以防大家觉得视频里的找不到,贴一下txt的贴图在下方)

在上传完修改后的json后,我们就可以开始微调了。分别点击微调模型和模型推理的运行按钮,在运行完成后,我们就可以打开界面尝试问一些以我们上传的产品数据集为基础的问题了:

学习来源于B站教程:【进阶篇】09.ChatGLM一键微调(微调过程)_哔哩哔哩_bilibili

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值