作业--基于 InternLM 和 LangChain 搭建你的知识库.md

本文讲述了作者如何选择中医文献作为垂直领域,构建专业知识库并利用阿里天池数据集改进模型性能。通过接入中医文献问答知识库,AI在处理如‘小儿发热是否必须吃退烧药’等问题时表现出更高的专业性和可信度,成功部署到OpenXLab。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

作业:

image-20240120160524507

进阶作业

选择一个垂直领域,收集该领域的专业资料构建专业知识库,并搭建专业问答助手,并在 OpenXLab 上成功部署

我选择的是中医文献问题知识库,从下图可以看到,目前InternLM模型并不能完美回答中医问题,特别是“小儿发热能否必须吃退烧药?”问题根本不知道。

image-20240120170022224

因此,我从阿里天池手机里中医文献问题生成数据集https://tianchi.aliyun.com/dataset/86895 ,中医文献问题生成数据集包括【黄帝内经翻译版】、【名医百科中医篇】、【中成药用药卷】、【慢性病养生保健科普知识】四个主要来源,共标注 13000对(问题、文档、答案),来源于3500篇文档,每篇文档由人工标注产生1~4对(问题, 答案)对。

需要更改两部分:

  1. 让程序能够识别json文件

image-20240120171915796

  1. 将加入我们下载的中医问答专业知识库

image-20240120172010334

之后部署到Openxlab
image-20240120172035363

可以看到,在接入中医文献问答知识库后,答案明显更专业也更可信,同时对加入中医文献问答知识库后前未回答的问题有了明确的答案。

image-20240120170750989

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值