spring Ai---向量知识库(二)

原创

已于 2025-04-22 10:54:44 修改 · 281 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#spring #人工智能 #java

于 2025-04-21 00:23:08 首次发布

RAG：检索增强，结合了检索和生成两种技术；用于提升生成模型的效果。
1.信息检索（R) ：系统从一个大型文档库中检索出与查询最相关的文档片段。这一步的目标是找到那些可能包含答案或相关信息的文档。
2.生成增强（A）：将检索到的文档片段与原始查询一起输入到大模型（如chatGPT）中，注意使用合适的提示词，比如原始的问题是XXX，检索到的信息是YYY，给大模型的输入应该类似于：请基于YYY回答XXXX。
3.输出生成（G) ：大模型基于输入的查询和检索到的文档片段生成最终的文本答案，并返回给用户。

通过垂直场景，通过实时更新知识库，无需重新训练模型；
实现过程中：
可按页进行分割，使用嵌入模型将文本转为向量表示；存储到数据库中(redis、es)；
用户提出问题，生成问题对应的向量；调用api的向量检索，找到相关文档；
在此类问题中，需要先处理的是进行文档PDF的存入向量中；
保存到本地磁盘中demo

        String filename = resource.getFilename();
        File target = new File(Objects.requireNonNull(filename));
        if (!target.exists()) {
   
   
            try {