作业:

进阶作业:
选择一个垂直领域,收集该领域的专业资料构建专业知识库,并搭建专业问答助手,并在 OpenXLab 上成功部署
我选择的是中医文献问题知识库,从下图可以看到,目前InternLM模型并不能完美回答中医问题,特别是“小儿发热能否必须吃退烧药?”问题根本不知道。

因此,我从阿里天池手机里中医文献问题生成数据集https://tianchi.aliyun.com/dataset/86895 ,中医文献问题生成数据集包括【黄帝内经翻译版】、【名医百科中医篇】、【中成药用药卷】、【慢性病养生保健科普知识】四个主要来源,共标注 13000对(问题、文档、答案),来源于3500篇文档,每篇文档由人工标注产生1~4对(问题, 答案)对。
需要更改两部分:
- 让程序能够识别json文件

- 将加入我们下载的中医问答专业知识库

之后部署到Openxlab

可以看到,在接入中医文献问答知识库后,答案明显更专业也更可信,同时对加入中医文献问答知识库后前未回答的问题有了明确的答案。

本文讲述了作者如何选择中医文献作为垂直领域,构建专业知识库并利用阿里天池数据集改进模型性能。通过接入中医文献问答知识库,AI在处理如‘小儿发热是否必须吃退烧药’等问题时表现出更高的专业性和可信度,成功部署到OpenXLab。
1055

被折叠的 条评论
为什么被折叠?



