Naive RAG 是一种基本的 RAG 实现,它通过向量搜索从嵌入存储中检索相关内容,并将其注入到提示(prompt)中,以便语言模型能够生成更准确的回答
Naive RAG(简单 RAG)
一旦我们的文档被摄取(参见前面的部分),我们可以创建一个 EmbeddingStoreContentRetriever 来启用简单的 RAG(检索增强生成)功能。
当使用 AI 服务时,可以按照以下方式配置简单的 RAG:
ContentRetriever contentRetriever = EmbeddingStoreContentRetriever.builder()
.embeddingStore(embeddingStore)
.embeddingModel(embeddingModel)
.maxResults(5) // 最多返回 5 个结果
.minScore(0.75) // 最小相似度分数为 0.75
.build();
Assistant assistant = AiServices.builder(Assistant.class)
.chatLanguageModel(model) // 使用指定的语言模型
.contentRetriever(contentRetriever) // 使用配置好的内容检索器
.build