如何实现查询重写优化RAG的LangChain应用

最新推荐文章于 2025-07-29 22:53:47 发布

GEAWfaacc

最新推荐文章于 2025-07-29 22:53:47 发布

阅读量499

点赞数 4

CC 4.0 BY-SA版权

文章标签： langchain python

本文链接：https://blog.youkuaiyun.com/GEAWfaacc/article/details/145291752

在增强型检索的大型语言模型中，查询重写是一种优化RAG（Retrieval-Augmented Generation）的方法，本文将为您详细介绍如何设置和使用一个名为rewrite_retrieve_read的模板。

技术背景介绍

在自然语言处理和信息检索领域，查询重写（query transformation）是一种通过修改用户输入的查询来提高检索效果和生成准确性的技术。它在大型语言模型（如OpenAI模型）中尤为重要，特别是在RAG场景中，通过重写查询可以更好地利用外部知识库。

核心原理解析

rewrite_retrieve_read模板通过改写查询的方式，使模型更高效地进行信息检索和生成。基于LangChain框架的实现，它将复杂的查询转化为易于模型理解和处理的形式，从而提高模型的准确性和效率。

代码实现演示

以下是如何在项目中设置并使用rewrite_retrieve_read模板的详细步骤：

环境设置

确保您已设置OPENAI_API_KEY环境变量以访问OpenAI模型。

安装LangChain CLI

pip install -U langchain-cli

创建新项目或添加到现有项目

要创建一个新的LangChain项目并安装此模板：

langchain app new my-app

最低0.47元/天解锁文章

200万优质内容无限畅学

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

GEAWfaacc

关注关注

4
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

RAG 技术实战：LangChain4j 的文档处理与检索增强生成

洛阳泰山的博客

04-15

1640

**文章摘要**：本文深入解析 LangChain4j 中的 RAG（检索增强生成）技术，详细阐述其核心原理与应用场景。RAG 通过检索相关信息并注入提示，显著提升 LLM 的回答准确性，减少幻觉。文章从简单 RAG、基本 RAG 到高级 RAG 的实现路径逐步展开，涵盖文档加载、嵌入存储、内容检索等关键环节，并提供 LangChain4j 的 API 使用指南。通过优化查询转换、多源检索与内容聚合，RAG 技术在问答系统、知识库检索等领域展现出强大的实用性。本文为开发者提供从入门到精通的完整实践路径

如何使用LangChain和LangGraph大幅提升RAG效果

musicml的博客

03-27

2432

▼最近直播超级多，预约保你有收获—1—LangChain 的2大核心概念1、面向过程架构设计的 Chains（链）：基于大模型编写的程序，遵循预定义的步骤和规则，并且不可灵活调整，用于执行任务，比如：自动 SQL 编写或多轮对话等。2、面向目标架构设计的 Agents（智能体）：基于大模型的推理能力，对任务做出规划，然后使用第三方工具（比如：搜索工具、代码解释器、业务 API 等）完成规划子任务...

参与评论您还未登录，请先登录后发表或查看评论

使用LangChain实现重写-检索-读取查询优化

adfyvatbia的博客

10-04

895

本文介绍了如何使用LangChain实现重写-检索-读取查询优化的方法。通过详细的环境配置和代码示例，相信你已经能够顺利上手。LangChain官方文档OpenAI API文档FastAPI文档。

[优化RAG体验：通过LangChain实现查询重写与检索]

tt_jishu的博客

11-15

327

通过本文，您可以在LangChain中高效应用来优化RAG的查询重写过程。更多信息可参阅LangChain的官方文档和LangSmith平台。

大模型：多种RAG组合优化（langchain实现）

DEVELOPERAA的博客

06-03

562

这篇文档整合了多种rag优化策略，并且使用langchain实现。可以有效的解决幻觉的问题。

高级RAG检索中的五种查询重写策略_用于检索增强的大型语言模型的查询重写

python12222_的博客

07-08

1306

检索增强生成 (RAG) 作为人工智能 (AI) 领域的一项重要技术，近年来得到了飞速发展。它将基于检索模型和基于生成的模型相结合，利用海量外部数据，生成更具信息量、更准确、更具语境相关性的回复。检索策略是 RAG 系统的关键组成部分，它直接影响着系统的性能和效率。在各种检索策略中，查询重写凭借其能够优化和改进检索过程，确保 AI 系统获取最相关信息的优势，成为了研究的热点。本文将深入探讨查询重写的机制、优势、挑战以及未来发展趋势，以期为相关研究和应用提供参考。

基于大模型LLM + LangChain的知识库检索优化探究

qq_51495214的博客

12-04

7057

本文讨论了基于LLM+Langchain搭建的知识库系统的检索准确度优化的可能点

LlamaIndex/Langchain实现RAG系统查询重写技术五大门派绝技

AI人工智能的学习之路

03-25

912

在检索增强生成（RAG）中，我们经常会遇到用户原不准确义信息。例如，像“2020年NBA冠军是洛杉矶湖人队！告诉我什么是langchain框架？”这样的查询，如果直接搜索，可能会从大语言模型（LLM）中得到错误或无法回答的响应。因此，将用户查询的语义空间与文档的语义空间对齐至关重要。查询重写技术可以有效解决这个问题。它在RAG中的作用如图1所示：查询重写是对齐查询和文档语义的关键技术。目前这方面有五大门派，各有绝技。

自然语言处理: 第十六章RAG的优化技术

victor_manches的博客

03-18

2020

简单来说就是由LLM驱动根据不同的query 去选择索引的数据库，或者根据query 的语义相似度去配置不同的prompt。

使用LangChain和Llama-Index实现多重检索RAG

csdn1561168266的博客

04-18

3118

大家好，在信息检索的世界里，查询扩展技术正引领着一场效率革命。本文将介绍这一技术的核心多查询检索，以及其是如何在LangChain和Llama-Index中得到应用的。

RAG优化技巧|7大挑战与解決方式|提高你的LLM能力

pythonhy的博客

05-11

1300

在当今快速发展的人工智能领域，大型语言模型（LLM）已经成为无处不在的技术，它们不仅改变了我们与机器交流的方式，还在各行各业中发挥着革命性的影响。

关于RAG优化的几个小技巧

平方的程序猿的专栏

02-19

756

这类方法的思路是分为两个步骤进行检索，首先通过摘要部分进行召回检索，过滤出可能和当前问题相关的候选文档集，然后再利用切片索引，从候选的文档集中进行检索，召回相关的知识切片。另一方面，在实际的业务场景中，准确率可能是现阶段最重要的问题，业务人员对于应用的要求可能是90分，而LLM目前的能力只能达到60分，如果不能通过其它的方式提升效果，那么应用可能无法在实际场景中使用了。一种处理的方案是，通过分割和存储小块数据来实现，在检索过程中，它首先获取小块，然后查找这些块的父ID，并返回那些较大的文档。

langchain RAG: Query Transformation (查询转换)

sinat_35153174的博客

04-25

344

将用户输入转换为更有效的检索查询，通过语义优化提升检索结果的相关性和覆盖率。理解简单一点就是,将来一个查询（query）生成多个不同问法，最后一起检索。突破词汇不匹配（Vocabulary Mismatch）的检索瓶颈。您是一个很有帮助的助手，可以基于单个输入查询生成多个搜索查询。通过对用户问题生成多个视角，您的目标是提供帮助。给定用户问题的不同版本，以从向量中检索相关文档。用户克服了基于距离的相似度搜索的一些限制。提供以换行符分隔的备选问题。生成与以下内容相关的多个搜索查询。提高长尾问题的处理效果。

AI实践与学习6-RAG流程优化学习

xiaosi的博客

06-15

1249

RAG流程很多细节优化点，助力AIGC。

LangChain进阶指南：RAG实践总结

优快云_224022的博客

02-07

1484

在基于 LLM实现的问答系统中使用 RAG 有三方面的好处：确保 LLM 可以回答最新，最准确的内容。并且用户可以访问模型内容的来源，确保可以检查其声明的准确性并最终可信。通过将 LLM建立在一组外部的、可验证的事实数据之上，该模型将信息提取到其参数中的机会更少。这减少了 LLM 泄露敏感数据或“幻觉”不正确或误导性信息的机会。RAG 还减少了用户根据新数据不断训练模型并随着数据的变化更新训练参数的需要。通过这种方式企业可以减低相关财务成本。

【大模型从入门到精通19】开源库框架LangChain LangChain文档加载器1

kaggle expert，全球排名前1000，清华计算机研究生，兴趣算法工程

08-13

1811

在数据驱动的应用领域，特别是涉及对话界面和大型语言模型（LLM）的应用中，从各种来源高效加载、处理并与数据进行交互的能力至关重要。这些加载器擅长处理来自公共源的数据，如 YouTube、Twitter 和 Hacker News，同时也适用于来自专有源的数据，如 Figma 和 Notion。保存清洗后的文本：可选地，脚本可以将清洗和分词后的文档文本保存到文件中。这个扩展的代码提供了一个更全面的示例，展示如何从加载和清洗文本到基本分析和处理特殊情况，对 PDF 文档进行程序化的处理。

专业Python爬虫实战教程：逆向加密接口与验证码突破完整案例

最新发布

ZTLJQ的博客

07-29

364

本文介绍了如何逆向分析并爬取一个采用JavaScript混淆和加密签名的内部测试系统API。主要步骤包括：1）分析网页结构，定位加密签名函数；2）使用Python还原JavaScript签名算法；3）实现验证码识别预处理；4）模拟登录流程获取会话；5）构造签名参数调用数据接口。案例综合运用了JavaScript逆向、加密算法还原、验证码识别等技术，通过requests.Session维护会话状态，最终实现了一个完整的自动化爬虫系统。

力扣30 天 Pandas 挑战（3）---数据操作

qq_66660756的博客

07-29

721

本文介绍了6道力扣Pandas简单题的解题思路：1) 177.第N高的薪水 - 通过去重排序获取第N高工资；2) 176.第二高薪水 - 类似177题的简化版；3) 184.部门最高薪员工 - 使用分组和合并查询部门最高薪；4) 178.分数排名 - 使用dense_rank()实现连续排名；5) 196.删除重复邮箱 - 通过排序和去重保留最小id记录；6) 1795.产品价格重构 - 使用melt()将宽表转为长表。这些题目涵盖了Pandas数据处理的基本操作，适合初学者练习数据清洗、转换和分析。

rag关键词检索

06-05

<think>嗯，用户现在提出了一个关于RAG（检索增强生成）的需求，看起来用户对检索增强生成的关键词和实现方法感兴趣。首先，我需要回顾一下之前的对话历史。之前用户似乎提到了系统级指令，要求使用特定的LaTeX格式和中文回答，还要生成相关问题。不过当前的查询集中在RAG技术上。用户明确提到要参考站内引用，但系统说明这些引用仅供参考，真正需要关注的是用户当前的问题。用户现在的问题是查找与RAG相关的关键词或实现方法。因此，重点应该放在RAG的核心概念、技术术语以及常用的实现方式上。首先，我需要确定用户可能的背景。用户可能是开发者、研究人员或者刚接触RAG的技术爱好者。由于用户询问关键词和实现方法，可能是在做项目或研究前的资料收集。用户可能希望了解如何搭建一个RAG系统，或者需要关键术语来进一步搜索资料。接下来，我需要梳理RAG的关键组成部分。检索增强生成通常分为检索和生成两个阶段。在检索阶段，重要的技术包括嵌入模型（如BERT、SentenceTransformers）、向量数据库（如Faiss、Milvus、Chroma）、以及检索策略（如密集检索、混合检索）。生成阶段则涉及语言模型（如GPT、Llama）和集成方式。此外，预处理和优化方法也很关键，比如分块策略和查询重写。用户可能还需要具体的实现方法。比如，使用LangChain这样的框架可以简化流程，或者直接通过API调用嵌入模型和向量数据库。是否要提到开源工具和云服务？比如HuggingFace的Transformers库，或者云服务如AzureAISearch，这些对实现有帮助。另外，评估指标如检索召回率、生成相关性也是用户可能关心的，但用户的问题更偏向于实现而非评估，可能需要优先前者。需要判断用户是否需要区分基础实现和高级优化。比如，基础的流程是文本嵌入->向量检索->结果传递给LLM生成。而高级方法可能包括迭代检索、上下文压缩或检索微调。但在回答中应该覆盖这两层，同时将基础部分放在前面，高级部分作为扩展。关键词方面，用户可能希望得到术语列表。比如嵌入模型、向量数据库、大语言模型、分块策略、RAG框架等。还要注意术语的英文对应词，如“hybridretrieval”对应混合检索，方便用户进一步搜索英文资料。最后，生成的相关问题需要考虑用户可能的进一步需求。比如应用场景（客服、文档摘要）、不同方法的优缺点（成本、准确性）、评估方法或框架选择等。这样用户可以根据回答深入探究特定方向。需要确保回答符合之前的系统指令：行内公式用$...$（虽然RAG可能较少需要公式，但如有相关指标如召回率$R@k$可以应用），独立公式用$$...$$。另外，引用文献时添加脚注，如引用原始RAG论文[^1]。同时使用中文，结构清晰分点说明。</think> 以下是与 **RAG（检索增强生成）** 相关的核心关键词和实现方法详解，结合最新技术实践整理： --- ### **一、核心关键词** 1. **检索阶段** - **嵌入模型**：Sentence Transformers、BERT、BGE - **向量数据库**：Faiss、Milvus、Chroma、Pinecone - **检索策略**：密集检索（Dense Retrieval）、稀疏检索（BM25）、混合检索（Hybrid） - **查询重写**：Query Expansion、HyDE（假设性文档嵌入）[^1] 2. **生成阶段** - **大语言模型（LLM）**：GPT-4、Llama 3、Claude - **上下文注入**：Prompt Engineering、ReRanking（如Cohere Rerank） - **知识增强**：External Knowledge Integration、Self-RAG[^2] 3. **系统优化** - **分块策略**：滑动窗口（Sliding Window）、语义分块（Semantic Chunking） - **评估指标**：检索召回率（Recall@k）、答案相关性（BERTScore） - **迭代检索**：Reciprocal Rank Fusion（RRF）、多步检索（Multi-step Retrieval） --- ### **二、主流实现方法** #### **基础流程** ```mermaid graph LR A[用户提问] --> B(查询嵌入) B --> C{向量数据库检索} C --> D[Top-k相关文档] D --> E[文档注入LLM上下文] E --> F[LLM生成答案] ``` #### **关键技术实现** 1. **LangChain框架（Python）** ```python from langchain_community.vectorstores import FAISS from langchain_community.embeddings import HuggingFaceEmbeddings # 1. 加载嵌入模型 embeddings = HuggingFaceEmbeddings(model_name="BAAI/bge-base-zh") # 2. 构建向量数据库 docs = ["文本1", "文本2", ...] # 知识库文档 vectorstore = FAISS.from_texts(docs, embeddings) # 3. RAG流程 retriever = vectorstore.as_retriever() results = retriever.get_relevant_documents("用户问题") ``` 2. **LlamaIndex优化方案** - 支持 **分层索引**（知识图谱+向量索引） - 自动查询路由（Query Routing）到最佳数据源 - 细粒度访问控制（按权限过滤文档） 3. **高级技术** - **FLARE架构**：主动检索机制（预测知识缺口触发检索） - **RA-DIT框架**：联合训练检索器与生成器[^3] - **DSPy编程模型**：声明式优化RAG流水线 --- ### **三、开源工具推荐** | 工具名称 | 核心功能 | 适用场景 | |----------------|------------------------------|-------------------| | **LlamaIndex** | 结构化/非结构化数据索引 | 企业知识库 | | **Haystack** | 端到端流水线构建 | 研究原型开发 | | **Quivr** | 本地化私有部署 | 敏感数据处理 | | **Unstructured**| PDF/PPT复杂文档解析 | 多格式文件处理 | --- ### **四、关键挑战与解决方向** 1. **文档边界问题** → 解决方案：动态上下文整合（Dynamic Context Integration） 2. **噪声干扰** → 解决方案：ReRank模块（如BAAI的bge-reranker） 3. **知识实时性** → 解决方案：增量索引更新（Delta Indexing） 4. **多模态检索** → 解决方案：CLIP跨模态嵌入[^4] ---