【建议收藏】RAG在AI体系中的位置与实现：从理论到代码实践

最新推荐文章于 2025-12-04 13:49:48 发布

原创最新推荐文章于 2025-12-04 13:49:48 发布 · 593 阅读

CC 4.0 BY-SA版权

文章标签：

#人工智能 #数据库 #大模型学习 #大模型 #java #RAG #ai大模型

RAG是AI体系中的知识增强架构，为LLM提供外部知识检索能力，如同智能体的"外脑"。文章通过最小Python原型实现，展示RAG四步走流程：文本向量化、存储检索、相似匹配、生成回答。RAG能提升回答精度和可靠性，利用最新信息并减少模型幻觉，但会降低响应速度。读者可通过自建知识库、多文档检索和向量可视化等练习巩固知识。

一、RAG 的核心思想

LLM（大语言模型）很聪明，但也健忘。它在训练时学了全世界几乎所有的知识，却不知道你项目里的专有信息。RAG 就是为它“外接一个知识图书馆”。

这就是“检索增强生成”四步走：

二、最小 RAG 原型设计

我们用一个极简 Python 原型（不依赖复杂框架），体会核心机制。组件如下：

模块	功能	示例
Embedding 模型	把文本转成向量	`text-embedding-3-small`
向量数据库	存储向量并做相似度搜索	FAISS
LLM	生成回答	GPT-4
Pipeline	输入 → 检索 → 拼接 → 输出	自行编写

三、最小可运行代码（Python + OpenAI + FAISS）

以下是教学级别的 RAG Demo，几行代码即可跑通。

⚙️ 依赖：pip install openai faiss-cpu numpy

from openai import OpenAI
import faiss
import numpy as np
# 初始化模型
client = OpenAI(api_key="替换为你的OpenAI API Key")
# 1. 知识库文本
docs = [
    "SAP RAP uses CDS views and behavior definitions to define business objects.",
    "In ABAP, EML stands for Entity Manipulation Language used in RAP.",
    "RAG (Retrieval Augmented Generation) combines external retrieval with LLM generation."
]
# 2. 生成向量并构建索引
embeddings = [client.embeddings.create(input=d, model="text-embedding-3-small").data[0].embedding for d in docs]
index = faiss.IndexFlatL2(len(embeddings[0]))
index.add(np.array(embeddings).astype("float32"))
# 3. 输入问题
query = "What is the relationship between RAP and EML?"
query_emb = client.embeddings.create(input=query, model="text-embedding-3-small").data[0].embedding
# 4. 检索最相似文本
_, I = index.search(np.array([query_emb]).astype("float32"), k=2)
retrieved_docs = [docs[i] for i in I[0]]
# 5. 拼接上下文并让 GPT 生成回答
context = "\n".join(retrieved_docs)
prompt = f"""You are an SAP expert.
Use the following context to answer the question.
Context:
{context}
Question:
{query}
"""
answer = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[{"role": "user", "content": prompt}]
)
print(answer.choices[0].message.content)

 C:\Users\MengYuxin\myLearning\AI\rag_study> python hello_rag.py

四、运行后会发生什么

假设输入：

“What is the relationship between RAP and EML?”

模型会检索到：

- RAP uses CDS and behavior definitions.
- EML stands for Entity Manipulation Language used in RAP.

然后生成类似输出：

“In RAP, the Entity Manipulation Language (EML) provides a structured way to perform CRUD operations on business objects defined via CDS and behavior definitions.”

🎯 这就是 RAG 的核心作用：让模型引用真实知识，而不是编造答案。