基于讯飞星辰Maas平台的模型微调-《甄嬛传》的嬛嬛角色微调-优快云博客

讯飞星辰Maas平台 是一个模型微调的零代码平台，旨在简化模型微调过程，无需一行代码即可定制大模型！

数据集来源：https://github.com/datawhalechina/self-llm/blob/master/dataset/huanhuan.json

2023年起，以ChatGPT为开端的AI原生应用开始走进生产场景，无论是日常对话、创作生成、还是解答专业问题，似乎“无所不知、无所不能”。

其底层是相关企业所训练出来的通用大模型，使用过这类工具的同学都能感觉到，现有的通用模型在一些专业化或个性化的任务上，往往并不够 专业、精准 ，比如： 角色扮演 和 模拟特定人物的语气与行为 。

对于需要特定语言风格、情感表达和人物设定的任务，标准大模型往往难以做到精准模仿。在这种情况下， 定制专属大模型 的技术被广泛关注，我们期待通过投喂特定语料，改造大模型，让模型在某些专业领域或特定任务中表现得更为出色。

这次，我们将 基于《甄嬛传》剧本中的甄嬛台词 ，通过五个简单的步骤，不写一行代码，打造一个模仿甄嬛语气、风格的专属聊天模型—— Chat-嬛嬛 。

微调

真正复杂的工作都是在 清洗数据、处理、生成数据、归类数据 上，这些才是影响最后效果的最大难点问题。

——散步，Tianji作者

微调的数据集是定制大模型的关键

我们常见的微调数据集需要符合 Alpaca格式 ，以我们使用的嬛嬛数据集为例，其样本如下：

{
    "instruction": "小姐，别的秀女都在求中选，唯有咱们小姐想被撂牌子，菩萨一定记得真真儿的——",
    "input": "",
    "output": "嘘——都说许愿说破是不灵的。"
}

字段说明 ：

1. 点击【创建模型】

2.配置基础信息（PS：Spark Lite更快）

3. 点击【创建数据集】

4. 配置数据集信息

5. 导入我们的嬛嬛数据集！

6. 提交任务！

看到这张图，就妥了！

PS：已经创建过的不必重复创建，直接点选即可~

1. 点击【创建新应用】

2. 按需填写内容即可

💡

大家稍微去看两个视频，或者稍微思考思考微调的定义，大概10分钟，就能得到我们的嬛嬛模型！

然后让我们发布服务，开始体验吧~

1. 看到这个✅就说明任务已完成！AI嬛嬛已ready！

可以看到完成微调大概需要10分钟，
试着点击一下，还能看到任务细节哟~

      如果没有看到可选的应用的话，
      记得回去做Step4哟~

2. 然后，发布服务！

3. 点击【体验】(可能需要等一小会~多刷新)

4. 选择想对比的模型