项目背景
众所周知,JSON是目前广泛使用的数据交互格式之一,当大模型能够稳定输出Json格式的数据之后,我们就可以拿输出的数据与前端、数据库、操作系统、物联网终端设备等等实现很多交互的行为动作,从而做出更好玩更有价值的大模型原生应用。
本项目以⚡问卷生成
⚡任务为例,演示如何控制ERNIE Bot的格式化输出,并将输出结果与前端交互,实现从Prompts直接生成问卷网页的效果。
难点分析
本项目的难点主要在于多层嵌套数据结构体
的控制生成。
- 单层数据结构:
单层数据结构是类似于{key: value, key: value, …}
这样只有一层键值对关系的,相对来说比较简单,生成可控度高,不容易出错。
{
"address": "北京市朝阳区XXX路XXX号",
"date": "2023-06-25",
"email": "zhangsan@example.com",
"idcode": "110101199003077777",
"name": "张三",
"phone": "13800000000",
"sex": "男"
}
- 多层嵌套数据结构:
多层嵌套数据是比较复杂的数据结构,如下例子所示,在address
的第一层级下,嵌套了第二层级的city
、area
、road
和detail
字段,在真实业务场景中,数据结构体往往是多层级嵌套,字段多,嵌套关系也比较复杂,因此该类数据结构体生成的难度比较大,容易出现一些纰漏导致数据解析不正确而报错。
{
"address": {
"city": "北京市",
"area": "朝阳区",
"road": "XXX路",
"detail": "XXX号"
},
"date": "2023-06-25",
"email": {
"common": "zhangsan@example.com",
"backup": "zhangsan@example1.com"
},
"idcode": "110101199003077777",
"name": "张三",
"phone": "13800000000",
"sex": "男"
}
本项目的问卷生成任务,本质上就是生成一个多层嵌套数据结构体的数据,下面开始给大家演示和解析代码。
开始上手
1. 安装依赖
In [ ]
!pip install erniebot --upgrade
!pip install llm2json
2. 配置ERNIE Bot
⚠ 注意:请配置ERNIE Bot的access_token,否则将无法继续运行。
In [2]
import erniebot
erniebot.api_type = "aistudio"
erniebot.access_token = "xxxxxxxxxxxxxxxxxxx"
def ernieChat(content):
response = erniebot.ChatCompletion.create(model="ernie-4.0",
messages=[{"role": "user", "content": content