作业:
进阶作业:
选择一个垂直领域,收集该领域的专业资料构建专业知识库,并搭建专业问答助手,并在 OpenXLab 上成功部署
我选择的是中医文献问题知识库,从下图可以看到,目前InternLM模型并不能完美回答中医问题,特别是“小儿发热能否必须吃退烧药?”问题根本不知道。
因此,我从阿里天池手机里中医文献问题生成数据集https://tianchi.aliyun.com/dataset/86895 ,中医文献问题生成数据集包括【黄帝内经翻译版】、【名医百科中医篇】、【中成药用药卷】、【慢性病养生保健科普知识】四个主要来源,共标注 13000对(问题、文档、答案),来源于3500篇文档,每篇文档由人工标注产生1~4对(问题, 答案)对。
需要更改两部分:
- 让程序能够识别json文件
- 将加入我们下载的中医问答专业知识库
之后部署到Openxlab
可以看到,在接入中医文献问答知识库后,答案明显更专业也更可信,同时对加入中医文献问答知识库后前未回答的问题有了明确的答案。