RAG实战案例：如何基于 LangChain 实现智能检索生成系统

原创

已于 2023-12-22 00:23:42 修改 · 1.8w 阅读

130 ·

CC 4.0 BY-SA版权

文章标签：

#增强检索生成（RAG） #AI实战 #LangChain #人工智能

于 2023-12-22 00:20:24 首次发布

本文聚焦人工智能领域，介绍检索增强生成（RAG）技术，它结合检索与生成模型，能提升大语言模型输出准确性。对比微调方法，RAG更灵活。还展示了利用Python、OpenAI模型、Weaviate数据库及LangChain构建RAG系统的步骤，为解决LLM处理特定信息不足提供有效方案。

该文章已生成可运行项目，

在人工智能领域，如何有效结合大型语言模型（LLM）的常识性知识与特定的专有数据，一直是业界探索的热点。微调（Fine-tuning）与检索增强生成（Retrieval-Augmented Generation，简称RAG）两种方法各有千秋，且都对此问题有着不可忽视的贡献。

本文将重点介绍RAG的理论基础，并展示如何利用LangChain、GPT大模型以及Weaviate矢量数据库搭建一个简易的RAG流程。

什么是检索增强生成

检索增强生成 (RAG) 是一种使用来自私有或专有数据源的信息来辅助文本生成的技术。它将检索模型（设计用于搜索大型数据集或知识库）和生成模型（例如大型语言模型 (LLM)，此类模型会使用检索到的信息生成可供阅读的文本回复）结合在一起。

通过从更多数据源添加背景信息，以及通过训练来补充 LLM 的原始知识库，检索增强生成能够提高搜索体验的相关性。这能够改善大型语言模型的输出，但又无需重新训练模型。额外信息源的范围很广，从训练 LLM 时并未用到的互联网上的新信息，到专有商业背景信息，或者属于企业的机密内部文档，都会包含在内。

RAG 对于诸如回答问题和内容生成等任务，具有极大价值，因为它能支持生成式 AI 系统使用外部信息源生成更准确且更符合语境的回答。它会实施搜索检索方法（通常是语义搜索或混合搜索）来回应用户的意图并提供更相关的结果。

但问题在于，尽管最先进的LLM经过大量数据训练，拥有广泛的常识性知识，但在需要生成训练数据之外的知识时，如最新、专有或特定领域信息时，LLM可能会出现不准确的情况。以下就是一个典型的例子：

问题：最新的华为Mate手机有哪些创新功能？

回答：抱歉，但我无法访问实时信息，我的知识只更新到2023年初。因此，如果华为Mate系列手机在那之后发布了新的型号或功能，我将无法为您提供具体信息。为了获取最新信息，我建议您查看最新的新闻资源或华为的官方声明。

因此，如何将LLM的常识与其他背景知识有效结合，以生成更准确、更符合实际情况的答案，成为了一个关键问题。这样才能帮助 LLM 生成更准确、更符合语境的补全，同时减少幻觉。

解决方案

传统上，我们通过微调来使神经网络适应特定领域或信息。这种方法虽然有效，但同时也存在计算资源消耗大、成本高昂且技术要求高等问题。因此，灵活适应不断变化的信息成为了一个挑战。

2020年，Lewis 等人在论文《知识密集型 NLP 任务的检索增强生成》(Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks) [4] 中，提出了一种更为灵活的技术——检索增强生成（Retrieval-Augmented Generation，RAG）。该研究将生成模型与检索模块结合起来，能够从易于更新的外部知识源中获取额外信息。

用一个简单的比喻来说， RAG 对大语言模型（Large Language Model，LLM）的作用，就像开卷考试对学生一样。在开卷考试中，学生可以带着参考资料进场，比如教科书或笔记，用来查找解答问题所需的相关信息。开卷考试的核心在于考察学生的推理能力，而非对具体信息的记忆能力。

同样地，在 RAG 中，事实性知识

本文章已经生成可运行项目