使用LangChain实现RAG-Self-Query：从零快速上手

最新推荐文章于 2025-11-25 13:11:49 发布

原创

最新推荐文章于 2025-11-25 13:11:49 发布 · 409 阅读

4 ·

CC 4.0 BY-SA版权

文章标签：

#langchain #jenkins #运维 #python

引言

在现代信息检索中，RAG（Retrieval-Augmented Generation）是一种颇受欢迎的技术，结合了信息检索与生成任务。本文将详细介绍如何利用LangChain库与自查询（Self-Query）技术在Elasticsearch中实现RAG。我们将逐步讲解环境配置、项目设置以及相关的代码示例。

主要内容

1. 环境设置

首先，我们需要设置OpenAI和Elasticsearch的环境变量以确保与这些服务的连接。对于OpenAI模型，确保您已设置OPENAI_API_KEY。

对于Elasticsearch，您可以通过云或者本地Docker方式进行设置：

云设置：

export ELASTIC_CLOUD_ID=<CLOUD_ID>
export ELASTIC_USERNAME=<CLOUD_USERNAME>

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

tt_jishu

关注关注

5
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

使用langchain与你自己的数据对话(三)：检索(Retrieval)

weixin_42608414的博客

07-27

7405

今天我们学习了很多有用的新技术比如最大边际相关性(MMR)，MMR可以让搜索结果保持相关性和多样性，这样可以避免出现冗余的搜索结果，除此之外我们可以定义元数据的过滤条件，这样向量数据库可以更加精准的搜索和问题相关的答案。

使用自查询技术在LangChain中实现RAG

qahaj的博客

02-27

411

基于检索的生成（RAG）是一种将信息检索与生成模型相结合的技术，通过知识库中的检索结果来生成相关的回答。自查询技术通过引入LLM，使得用户的自然语言查询可以被自动转换为结构化的查询，从而提高检索的准确性。

参与评论您还未登录，请先登录后发表或查看评论

跟着 bRAG-langchain学RAG，小白也能上手的5个Notebook实战体验

小程故事多的博客

10-15

771

简单来说，RAG是一种将信息检索与生成式AI结合的技术。传统的大语言模型依赖于训练时学到的知识，但这些知识可能过时、不完整，或者在特定领域不够深入。RAG的核心思路是：当用户提出一个问题时，系统先从海量文档中检索出与问题相关的信息片段，再将这些片段作为“上下文”输入给生成模型，让模型基于这些真实数据生成回答。这样一来，回答不仅具有逻辑性，还能保证内容的准确性和时效性。

RAG-Anything：多模态RAG的全能王者，AI文档处理的终极形态！

许泽宇的技术分享

07-12

1466

在AI圈混久了，大家都知道RAG（Retrieval-Augmented Generation）是大模型落地的“黄金搭档”。但你有没有发现，现实世界的文档早已不是单纯的文本堆砌？学术论文、财报、技术文档、PPT、甚至日常的会议纪要，哪个不是“图文表公式”齐飞，内容花样百出？传统RAG系统，面对这些“混搭风”文档，往往只能“望图兴叹”，遇到表格就“表”情凝重，碰到公式就“公式”无措。

基于LangChain-Chatchat实现的本地知识库的问答应用-快速上手（检索增强生成(RAG)大模型）

python1222_的博客

03-31

909

一种利用langchain思想实现的基于本地知识库的问答应用，目标期望建立一套对中文场景与开源模型支持友好、可离线运行的知识库问答解决方案。受的项目和创建的启发，建立了全流程可使用开源模型实现的本地知识库问答应用。本项目的最新版本中通过使用FastChat接入 Vicuna, Alpaca, LLaMA, Koala, RWKV 等模型，依托于langchain框架支持通过基于FastAPI提供的 API 用服务，或使用基于Streamlit的 WebUI 进行操作。

RQ-RAG：提升检索增强生成模型的查询精炼能力

人工智能讲师分享前沿技术

09-11

1921

大模型在面对未见场景时，往往会产生不准确或虚构的回答，这限制了它们的实用性。为了解决这一问题，香港科技大学、香港理工大学和麻省理工学院的研究团队提出了一种名为RQ-RAG（Retrieval-Augmented Generation with Query Refinement）的方法，旨在通过检索增强生成（RAG）的方式，结合外部文档，提升模型对复杂查询的处理能力。

揭秘Self-RAG：引领大型语言模型生成质量的新潮流！

lyy2017175913的博客

10-17

1125

Self-RAG（Self-Reflective Retrieval-Augmented Generation）是一种新型的检索增强生成框架，旨在提高大型语言模型（LLM）的生成质量和准确性。Self-RAG通过引入“反思标记”（reflection tokens），使得模型能够根据具体需求动态决定是否进行信息检索。这种方法不仅减少了不必要的检索操作，还提高了生成内容的准确性和相关性。

RAG 系统评估与优化指南：从 RAGAS 到 ARES 的实战应用

zhangzhentiyes的博客

06-14

962

摘要：RAG系统评估的科学方法论当前RAG系统开发中存在严重依赖主观测试的问题，导致系统性能难以量化衡量。本文提出建立科学评估体系的必要性，并介绍四大核心指标：答案忠实度（衡量生成内容与上下文的匹配度）、答案相关性（评估回答与问题的契合度）、上下文精度（检索信息的精准度）和上下文召回率（检索信息的全面性）。通过RAGAS和ARES两大评估框架的对比，展示如何将理论指标转化为可操作的量化评估工具，为RAG系统优化提供数据支撑。

收藏必学！LangChain大模型应用开发面试指南：从核心概念到RAG实战

2401_84815887的博客

09-03

1114

本文全面介绍LangChain框架核心概念（Models、Prompts、Indexes、Memory、Chains、Agents）及LCEL优势，深入讲解RAG实现流程与文档切分策略，对比LlamaIndex与LangChain差异，详解Agent执行流程（ReAct框架）和自定义Tool实现方法，分享RAG评估优化策略。内容从基础到实战，适合大模型开发学习与面试准备。

Self-RAG框架实战手册：问答系统的自适应进化秘诀

[【RAG 论文】Self-RAG：引入自我反思的大模型 RAG 框架](https://www.chatbees.ai/_next/image?url=%2Fimages%2Fgraphics%2Fsys-rag-score.png&w=1080&q=75) # 1. 问答系统的自适应进化概述在现代信息技术飞速...

从传统RAG到Graph RAG：知识图谱技术驱动下的链路转型与融合策略[DB-GPT、OpenSPG、Tugraph三合一]

丨汀、的博客

09-10

1128

从传统RAG到Graph RAG：知识图谱技术驱动下的链路转型与融合策略

Qwen-Agent智能体框架：阿里又一开源王炸！附详细教程

hunteritself的博客

01-05

5119

Qwen-Agent智能体框架：阿里又一开源王炸！附详细教程

【大模型从入门到精通19】开源库框架LangChain LangChain文档加载器1

kaggle expert，全球排名前1000，清华计算机研究生，兴趣算法工程

08-13

2219

在数据驱动的应用领域，特别是涉及对话界面和大型语言模型（LLM）的应用中，从各种来源高效加载、处理并与数据进行交互的能力至关重要。这些加载器擅长处理来自公共源的数据，如 YouTube、Twitter 和 Hacker News，同时也适用于来自专有源的数据，如 Figma 和 Notion。保存清洗后的文本：可选地，脚本可以将清洗和分词后的文档文本保存到文件中。这个扩展的代码提供了一个更全面的示例，展示如何从加载和清洗文本到基本分析和处理特殊情况，对 PDF 文档进行程序化的处理。

开始使用 Elastic Agent Builder 和 Microsoft Agent Framework

Elastic 中国社区官方博客

11-23

805

Elastic 9.2推出AgentBuilder技术预览版，帮助开发者快速创建基于Elasticsearch数据的AI工具和代理。本文演示了完整流程：首先创建Elastic项目并添加数据索引，然后通过AgentBuilder开发工具和代理，最后使用Microsoft Agent Framework的A2A协议调用该代理。整个过程包括创建索引、构建工具、配置代理指令，并通过Python示例展示了如何将Elastic代理集成到外部应用中。该功能使开发者能快速构建具有专业数据能力的AI代理，并支持与其他开发框架

elasticsearch 使用 systemd 启动时卡在 starting 状态解决过程记录

weixin_43707146的博客

11-23

475

是运行 Elasticsearch 核心功能的主 Java 进程。从上面的截图上可以看到，elasticsearch.service 的 Main PID 是 15688 ，即 /usr/local/elasticsearch/jdk/bin/java -Xms4m -Xmx64m…这里还有一个重点，修改后的 Main PID 变成了 /usr/local/elasticsearch/jdk/bin/java -Des.networkaddress.cache.ttl=60…

Jenkinsfile保存在项目根目录下的好处

m0_60008263的博客

11-23

736

day62-gitlab和JenKins

a2354716112的博客

11-24

933

gitlab的两种代码上传方式gitlab合并请求Jenkins的安装部署Jenkins自动拉取代码更新SonarQube代码自动检测。

对Docker部署的MySQL中的数据进行备份恢复