基于LLM+向量库的文档对话经验篇

xianghan收藏册

于 2024-11-18 07:29:05 发布

阅读量894

点赞数 32

分类专栏： AI大模型文章标签：人工智能 chatgpt transformer

本文链接：https://blog.youkuaiyun.com/xianghanscce/article/details/143842637

版权

如何将外部知识注入大模型，最直接的方法：利用外部知识对大模型进行微调

既然大模型微调不是将外部知识注入大模型的最优方案，那是否有其它可行方案？

基于LLM+向量库的文档对话核心技术：embedding
思路：将用户知识库内容经过 embedding 存入向量知识库，然后用户每一次提问也会经过 embedding，利用向量相关性算法（例如余弦算法）找到最匹配的几个知识库片段，将这些知识库片段作为上下文，与用户问题一起作为 promt 提交给 LLM 回答

已知信息：
{context} 


根据上述已知信息，简洁和专业的来回答用户的问题。如果无法从中得到答案，请说 “根据已知信息无法回答该问题” 或 “没有提供足够的相关信息”，不允许在答案中添加编造成分， 答案请使用中文。 
问题是：{question}

二、基于LLM+向量库的文档对话优化面

问题1：如何让LLM简要、准确回答细粒度知识？

用户：2023年我国上半年的国内生产总值是多少？
LLM：根据文档，2023年的国民生产总值是593034亿元。

-举例及标答如下：
在这里插入图片描述

用户：根据文档内容，征信中心有几点声明？

LLM：根据文档内容，有三点声明，分别是：一、…；二…；三…。

要实现语义级别的分割，而不是简单基于html或者pdf的换行符分割。
笔者发现目前的痛点是文档分割不够准确，导致模型有可能只回答了两点，而实际上是因为向量相似度召回的结果是残缺的。

有人可能会问，那完全可以把切割粒度大一点，比如每10个段落一分。但

基于LLM+向量库的文档对话 经验篇