今天,让我们来尝试着开始简单的微调,熟悉熟悉微调是怎么改变模型的。
首先,通过视频教程,我们在阿里云领取免费算力,创建一个DSW实例,并在其中打开轻量轻量微调和推理ChatGlm模型。(由于版本更新,需要先打开,在Langcher界面点击tool下的DSW Gallery)
然后依次按照教程里的指示,把我们需要的包,数据等用于微调必要的组件都下载好(只需要点击类似于播放键的按钮下载,等到其出现绿色即可)
在下载完数据后,我们根据其路径提示找到并打开它:
可以看到这是一个关于淘宝电商的数据集,summary前是产品特点,也就是关键词,后面是产品的详细说明。
将视频里所说的txt文档粘贴到json文件的最后并保存上传到DSW里。(以防大家觉得视频里的找不到,贴一下txt的贴图在下方)
在上传完修改后的json后,我们就可以开始微调了。分别点击微调模型和模型推理的运行按钮,在运行完成后,我们就可以打开界面尝试问一些以我们上传的产品数据集为基础的问题了:
学习来源于B站教程:【进阶篇】09.ChatGLM一键微调(微调过程)_哔哩哔哩_bilibili