AI 二、Python中，RAG的应用

原创已于 2025-02-24 17:14:18 修改 · 461 阅读

4 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能 #python #开发语言

于 2025-02-24 16:14:17 首次发布

ai 专栏收录该内容

16 篇文章

订阅专栏

Python3.10

Conda

Python

Python 是一种高级、解释型、通用的编程语言，以其简洁易读的语法而闻名，适用于广泛的应用，包括Web开发、数据分析、人工智能和自动化脚本

RAG（Retrieval-Augmented Generation）技术是一种将检索和生成结合在一起的方法，通常用于增强生成模型的能力，特别是在处理知识密集型任务时。RAG的核心思想是：通过检索外部知识库中的相关信息来增强生成模型的上下文，从而生成更为准确和丰富的答案。

在RAG中，检索模块负责从外部文档、知识库或数据库中获取相关的片段或文档，然后将这些片段与用户的查询一起输入生成模型，生成模型使用这些信息来生成回答。

RAG的应用

RAG广泛应用于以下几个领域：

开放域问答：通过检索大量文档来回答问题，而不是仅依赖模型的内部知识。
文本生成：结合外部信息生成内容丰富的文本，如新闻摘要、技术文档生成等。
知识图谱：生成和查询基于知识图谱的内容。

RAG模型工作流程

RAG的工作流程通常分为两个阶段：

检索阶段：基于查询从一个大规模文档库（如Wikipedia）或数据库中检索相关片段。
生成阶段：将检索到的片段与原始查询一起作为输入，送入生成模型（如GPT、BART等）生成最终答案。

使用Python实现RAG

1. 安装依赖

首先，安装transformers和faiss库，这里使用Hugging Face的transformers库实现生成模型，使用FAISS进行向量检索。

pip install transformers faiss-cpu

2. 构建检索和生成模块

我们可以通过以下步骤实现一个简单的RAG系统：

构建检索器：通过使用FAISS索引将文档转换为向量，进行快速相似度搜索。
构建生成器：使用transformers中的生成模型（例如BART）生成答案。

示例：简单的RAG系统

import faiss
import numpy as np
from transformers import BartForConditionalGeneration, BartTokenizer
from sklearn.feature_extraction.text import TfidfVectorizer

# 构建简单的检索器
class SimpleRetriever:
    def __init__(self, documents):
        self.documents = documents
        # 使用TF-IDF向量化器
        self.vectorizer = TfidfVectorizer()
        self.doc_vectors = self.vectorizer.fit_transform(documents)
        
    def retrieve(self, query, top_k=3):
        query_vector = self.vectorizer.transform([query])
        # 计算查询与文档的相似度
        similarities = np.dot(self.doc_vectors, query_vector.T).toarray().flatten()
        top_k_indices = similarities.argsort()[-top_k:][::-1]
        return [self.documents[i] for i in top_k_indices]

# 示例文档库
documents = [
    "The Eiffel Tower is a wrought-iron lattice tower on the Champ de Mars in Paris, France.",
    "The Grand Canyon is a steep-sided canyon carved by the Colorado River in the state of Arizona, USA.",
    "Python is a programming language that lets you work quickly and integrate systems more effectively."
]

# 初始化检索器
retriever = SimpleRetriever(documents)

# 初始化BART生成模型和tokenizer
model_name = "facebook/bart-large-cnn"
model = BartForConditionalGeneration.from_pretrained(model_name)
tokenizer = BartTokenizer.from_pretrained(model_name)

# 查询输入
query = "Tell me about the Eiffel Tower."

# 使用检索器获取相关文档
retrieved_docs = retriever.retrieve(query)

# 将检索到的文档拼接成一个上下文
context = " ".join(retrieved_docs)

# 将查询和上下文作为输入传递给生成模型
input_text = query + " " + context
inputs = tokenizer(input_text, return_tensors="pt", max_length=1024, truncation=True)

# 生成回答
summary_ids = model.generate(inputs["input_ids"], max_length=150, num_beams=4, early_stopping=True)
answer = tokenizer.decode(summary_ids[0], skip_special_tokens=True)

print("Generated Answer:", answer)