程序员的AI技术图谱

最新推荐文章于 2025-12-20 19:32:34 发布

原创

最新推荐文章于 2025-12-20 19:32:34 发布 · 356 阅读

CC 4.0 BY-SA版权

文章标签：

RAG 旨在解决大模型知识时效性差、幻觉问题，核心是 **“检索 + 生成”** 结合，流程分为以下步骤：

数据采集：获取结构化（数据库、表格）、半结构化（JSON、XML）、非结构化（文档、网页）数据；
数据清洗：去重、降噪、格式统一（如 PDF 转文本、HTML 解析）；
文档分块：将长文本切分为语义完整的小块（Chunk），避免上下文丢失（如按段落、固定长度 + 重叠窗口）；
向量化存储：用嵌入模型（如 BERT、Sentence-BERT、text-embedding-ada-002）将 Chunk 转为向量，存入向量数据库（如 Pinecone、Milvus、FAISS）。

plaintext

用户问题 → 问题向量化 → 向量数据库检索 → 上下文拼接 → 大模型生成 → 回答输出
       ↑                                      ↑
知识库构建（数据预处理→分块→向量化→存储）──────┘

MCP 解决单一上下文不足的问题，通过多轮提示、多源上下文协作提升任务效果，典型场景：复杂推理、多文档问答。

实战案例：多文档法律问答

步骤 3：构建多上下文 Prompt：

plaintext

基于以下法律条文和案例回答问题：
【法律条文】{检索到的条文}
【参考案例】{检索到的案例}
问题：{用户问题}
要求：严格依据上述内容