从普通RAG到RAPTOR，10个最新的RAG框架

最新推荐文章于 2025-09-23 13:46:41 发布

原创

最新推荐文章于 2025-09-23 13:46:41 发布 · 1.4k 阅读

·

28

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#自然语言处理 #语言模型 #LLM

大家好，大型语言模型（LLMs）如GPT-4在自然语言处理（NLP）领域有着重要作用，擅长生成文本、回答问题等任务。但这些模型也存在一些短板，比如对最新信息的掌握不足、难以实时更新知识库以及在处理大量信息时效率不高。

为了解决这些问题，检索增强生成（RAG）技术应运而生，它通过整合外部数据源，提升了模型的响应质量和适用性。今天将介绍10种改进版的RAG技术，它们在检索和生成环节上各有侧重，覆盖了从通用到特定问题的解决方案，能够体现出RAG在促进自然语言处理（NLP）进步中的多样性和巨大潜力。

1.标准检索增强生成（RAG）

标准RAG通过融合检索技术与大型语言模型（LLMs），可以生成既准确又符合上下文的响应，这打破了传统LLMs静态知识库的限制，能够动态利用外部数据源。

运作机制

文档分割：将大型文档切割成小块，便于管理和检索。
高效检索：用户提出查询后，系统迅速找到最相关的文档片段，利用相似性搜索技术。
上下文提示：将检索到的片段整合到LLMs的输入提示中，为其提供生成精准响应所需的上下文信息。

优势

实时交互：能够实现1-2秒内的快速响应，对于客户服务聊天机器人等应用非常关键。
提升答案质量：通过访问最新和特定领域的信息，使响应更加精准，更好地符合用户需求。

实施细节

检索器组件：通常采用密集向量嵌入技术（如FAISS模型）进行高效的相似性搜索。
生成器组件：LLMs处理增强后的提示，生成自然融入检索信息的响应。

应用场景

客户支持：通过检索相关政策文件或FAQs，提供精确答案。
搜索引擎：通过检索文档生成摘要，增强搜索结果的相关性。
知识管理系统：帮助用户从庞大的数据库中检索和理解复杂信息。

面临的挑战

可扩展性：需要优化检索机制，以高效处理大量数据。
延迟问题：随着数据集的增长，保持快速响应是一个挑战。
相关性过滤：必须确保检索到的文档与查询高度相关。

标准RAG有效地结合了检索系统和生成模型，使LLMs能够动态访问外部知识库，生成高质量、上下文相关的响应。

2.纠正检索增强生成（CRAG）

纠正检索增强生成（CRAG）旨在提高大型语言模型（LLMs）生成回答的准确性和可信度。它专注于发现并修正回答中的不准确之处或错误信息，确保提供的内容既精确又符合上下文。

运作机制

多遍过程：通过多次迭代检索和生成，不断提炼输出结果。
反馈循环：对每个生成的响应进行准确性和相关性评估，必要时触发纠正措施。
置信度评分：利用轻量级检索评估器为文档分配置信度分数，指导后续检索或生成步骤。

优势

提高精度：通过迭代提炼，确保更高的准确性，减少错误。
提升用户满意度：提高响应的可靠性，增强用户信任和满意度。
多功能性：CRAG的即插即用设计，方便与现有RAG系统无缝集成。

实施细节

检索评估器：评估检索文档的质量，依据相关性分数或领域特定标准。
纠正措施：可能包括细化查询、额外搜索或关注检索文档中的关键元素。
迭代提炼：持续迭代直至响应达到预设的质量标准。

应用场景

智能信息系统：确保相关响应的准确性和来源可靠性。
法律咨询服务：提供精确的法律信息，通过验证检索文档符合法律标准。
学术研究协助：通过提供准确的摘要和参考资料，协助研究人员。

面临的挑战

复杂性：在技术上实现有效的反馈循环和置信度评分机制具有挑战性。
资源密集型：多次检索和生成可能增加计算成本。
阈值设置：需要定义适当的置信度阈值，以平衡准确性和效率。

CRAG通过系统地识别和纠正生成响应中的错误，利用迭代提炼和反馈机制，提高了LLM输出的整体精度和可靠性。

3.推测检索增强生成（推测RAG）

最低0.47元/天解锁文章

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

python慕遥 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。