目录
一句话理解便是:embedding model 可以将文本转换为固定长度的连续向量。
4.2、调用embeddingAPI :将测试数据转换为向量数据
方案流程
- 将本地答案数据集,转为向量存储到向量数据。
- 当用户输入查询的问题时,把问题转为向量然后从向量数据库中查询相近的答案topK 这个时候其实就是我们最普遍的问答查询方案,在没有GPT的时候就直接返回相关的答案整个流程就结束了。
- 现在有GPT了可以优化回答内容的整体结构,在单纯的搜索场景下其实这个优化没什么意义。但如果在客服等的聊天场景下,引用相关领域内容回复时,这样就会显得不那么的突兀。
本项目的代码全部开源, GitHub地址为: