讯飞星辰Maas平台 是一个模型微调的零代码平台,旨在简化模型微调过程,无需一行代码即可定制大模型!
数据集来源:https://github.com/datawhalechina/self-llm/blob/master/dataset/huanhuan.json
2023年起,以ChatGPT为开端的AI原生应用开始走进生产场景,无论是日常对话、创作生成、还是解答专业问题,似乎“无所不知、无所不能”。
其底层是相关企业所训练出来的通用大模型,使用过这类工具的同学都能感觉到,现有的通用模型在一些专业化或个性化的任务上,往往并不够 专业、精准 ,比如: 角色扮演 和 模拟特定人物的语气与行为 。
对于需要特定语言风格、情感表达和人物设定的任务,标准大模型往往难以做到精准模仿。 在这种情况下, 定制专属大模型 的技术被广泛关注,我们期待通过投喂特定语料,改造大模型,让模型在某些专业领域或特定任务中表现得更为出色。
这次,我们将 基于《甄嬛传》剧本中的甄嬛台词 ,通过五个简单的步骤,不写一行代码,打造一个模仿甄嬛语气、风格的专属聊天模型—— Chat-嬛嬛 。
微调
真正复杂的工作都是在 清洗数据、处理、生成数据、归类数据 上,这些才是影响最后效果的最大难点问题。
——散步,Tianji作者
微调的数据集是定制大模型的关键
我们常见的微调数据集需要符合 Alpaca格式 ,以我们使用的嬛嬛数据集为例,其样本如下:
{
"instruction": "小姐,别的秀女都在求中选,唯有咱们小姐想被撂牌子,菩萨一定记得真真儿的——",
"input": "",
"output": "嘘——都说许愿说破是不灵的。"
}
字段说明 :
-
instruction
:任务的指令,模型需要完成的具体操作,一般可以对应到用户输入的 Prompt 。 -
input
:任务所需的输入内容。若任务是开放式的,或者不需要明确输入,可以为空字符串。 -
output
:在给定指令和输入的情况下,模型需要生成的期望输出,也就是对应的正确结果或参考答案。
1. 点击【创建模型】
2.配置基础信息(PS:Spark Lite更快)
3. 点击【创建数据集】
4. 配置数据集信息
5. 导入我们的嬛嬛数据集!
6. 提交任务!
Step4: 创建应用(点击可跳转)
链接:控制台-讯飞开放平台
PS:已经创建过的不必重复创建,直接点选即可~
1. 点击【创建新应用】
2. 按需填写内容即可
Step5:体验AI嬛嬛!
💡
大家稍微去看两个视频,或者稍微思考思考微调的定义,大概10分钟,就能得到我们的嬛嬛模型!
然后让我们发布服务,开始体验吧~
1. 看到这个✅就说明任务已完成!AI嬛嬛已ready!
可以看到完成微调大概需要10分钟,
试着点击一下,还能看到任务细节哟~
如果没有看到可选的应用的话,
记得回去做Step4哟~
2. 然后,发布服务!
3. 点击【体验】(可能需要等一小会~多刷新)