RAG的代码实现与实践：从零开始构建检索增强生成系统

CarlowZJ

已于 2025-07-26 16:17:31 修改

阅读量791

点赞数 7

CC 4.0 BY-SA版权

文章标签： python 开发语言 RAG RAG的代码实现与实践从零开始构建检索增强生成系统

于 2025-04-27 00:12:02 首次发布

本文链接：https://blog.youkuaiyun.com/csdn122345/article/details/147545387

引言

在上一篇博客中，我们深入探讨了RAG（检索增强生成）的概念、原理及其在不同场景中的应用。RAG通过结合检索和生成的优势，有效地解决了大型语言模型（LLM）在生成回答时可能出现的幻觉问题和知识截止日期的限制。然而，理解一个技术的理论是远远不够的，我们需要通过实际的代码实现来加深对RAG的理解。在本篇博客中，我们将从零开始构建一个完整的RAG系统，涵盖数据准备、索引构建、检索实现以及生成答案的全过程。通过具体的代码示例，读者将能够清晰地看到RAG技术在实际应用中的实现细节。

一、RAG的代码实现

（一）环境搭建

在开始代码实现之前，我们需要搭建一个合适的开发环境。以下是搭建环境所需的步骤：

安装Python：确保安装了Python 3.8或更高版本。

安装依赖库：使用pip安装以下依赖库：

bash

复制

pip install langchain openai weaviate-client transformers faiss-cpu

（二）数据准备

为了实现RAG，我们需要准备一个文档集合作为知识库。以下是数据准备的步骤：

收集文档：收集相关的文档，例如网页、书籍、研究报告等。为了方便演示，我们使用一个简单的文档集合。

分块处理：将文档进行分块处理，每个块通常包含几百个单词。以下是一个简单的分块函数示例：

Python

复制

def chunk_text(text, chunk_size=500):
    words = text.split()
    chunks = [' '.join(words[i:i + chunk_size]) for i in range(0, len(words), chunk_size)]
    return chunks

（三）嵌入生成与索引构建

接下来，我们需要对文档块生成嵌入向量，并将嵌入向量存储到索引结构中。以下是一个完整的代码示例：

Python

复制

import weaviate
from langchain.embeddings import OpenAIEmbeddings
from transformers import AutoTokenizer, AutoModel
import torch
import faiss
import numpy as np

# 初始化Weaviate客户端
client = weaviate.Client("http://localhost:8080")

# 创建类
class_obj = {
    "class": "Document",
    "properties": [
        {"name": "content", "dataType": ["text"]}
    ],
    "vectorizer": "text2vec-openai"
}
client.schema.create_class(class_obj)

# 使用Hugging Face的预训练模型生成嵌入
tokenizer = AutoTokenizer.from_pretrained("sentence-transformers/all-MiniLM-L6-v2")
model = AutoModel.from_pretrained("sentence-transformers/all-MiniLM-L6-v2")

def get_embedding(text):
    inputs = tokenizer(text, return_tensors="pt", padding=True, truncation=True, max_length=512)
    outputs = model(**inputs)
    embeddings = outputs.last_hidden_state.mean(dim=1).detach().numpy()
    return embeddings[0]

# 生成嵌入并添加到索引
documents = [
    "This is the first document. It contains some information about RAG.",
    "This is the second document. It provides more details about the implementation of RAG."
]
chunks = [chunk_text(doc) for doc in documents]

# 使用FAISS构建索引
dimension = 384  # 嵌入向量的维度
index = faiss.IndexFlatL2(dimension)

for chunk in chunks:
    for text in chunk:
        embedding = get_embedding(text)
        client.data_object.create({
            "content": text
        }, "Document", embedding)
        index.add(np.array([embedding]))

print("索引构建完成")

（四）检索与生成

在检索阶段，我们需要根据用户问题检索出与问题最相关的文档块。在生成阶段，我们将检索到的文档块与用户问题拼接，然后调用语言模型生成答案。以下是一个完整的代码示例：

Python

复制

from langchain.llms import OpenAI
from langchain.prompts import PromptTemplate

# 初始化语言模型
llm = OpenAI()

# 检索函数
def retrieve(query, top_k=3):
    query_embedding = get_embedding(query)
    D, I = index.search(np.array([query_embedding]), k=top_k)
    results = [client.data_object.get_by_id("Document", str(i))["properties"]["content"] for i in I[0]]
    return results

# 生成函数
def generate(query, retrieved_docs):
    prompt = PromptTemplate(
        input_variables=["query", "docs"],
        template="Answer the question based on the context.\n\nQuestion: {query}\n\nContext:\n{docs}"
    )
    context = "\n".join(retrieved_docs)
    prompt_text = prompt.format(query=query, docs=context)
    return llm(prompt_text)

# 示例
query = "What is RAG?"
retrieved_docs = retrieve(query)
answer = generate(query, retrieved_docs)
print(answer)

二、RAG的应用场景

（一）智能问答系统

RAG技术在智能问答系统中具有广泛的应用。通过检索外部知识库中的相关信息，RAG能够生成更准确、更可靠的答案。例如，我们可以使用LangChain框架和LLM构建基于文档的问答系统。

（二）教育领域

在教育领域，RAG可以用于生成教学设计、学习辅导等内容。例如，根据教学主题检索相关教育资源，辅助教师生成教学设计方案。

（三）企业内部知识管理

RAG技术还可以用于企业内部的知识管理。通过检索企业内部的知识库，RAG能够为企业员工提供快速准确的知识支持，提高工作效率。

（四）多模态应用

RAG技术还可以扩展到多模态应用中。例如，结合图像检索和文本生成，RAG可以回答与图像相关的问题，或者生成图像的说明。

三、RAG的注意事项

（一）数据质量

数据质量是RAG技术的关键。如果知识库中的数据不准确或不完整，RAG生成的答案也可能受到影响。因此，我们需要确保知识库中的数据是高质量的。

（二）检索效率

检索效率是RAG技术的另一个重要问题。如果检索速度太慢，可能会影响用户体验。因此，我们需要优化检索算法和索引结构，提高检索效率。

（三）生成质量

虽然RAG通过检索外部知识库能够提高生成答案的准确性，但仍然可能存在幻觉问题。因此，我们需要对生成的答案进行评估和筛选，确保其准确性和可靠性。

（四）隐私与安全

在使用RAG技术时，我们还需要注意隐私和安全问题。例如，知识库中的数据可能包含敏感信息，我们需要采取措施保护这些信息。

四、总结

在本篇博客中，我们从零开始构建了一个完整的RAG系统，涵盖了数据准备、索引构建、检索实现以及生成答案的全过程。通过具体的代码示例，读者可以清晰地看到RAG技术在实际应用中的实现细节。RAG技术通过结合检索和生成的优势，为语言模型提供了更准确、更可靠的知识支持。希望本文能够帮助读者更好地理解和应用RAG技术。