【收藏必备】RAG技术实战：智能问答平台构建全流程详解

原创于 2025-12-23 21:28:25 发布 · 338 阅读

12 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能 #面试 #语言模型 #ai #程序员 #转行 #产品经理

部署运行你感兴趣的模型镜像

目前公司的智能问答平台利用RAG技术构建，现给大家分享下通RAG技术构建智能问平台的具体流程和原理。

一、什么是RAG

RAG是检索增强生成技术（Retrieval-Augmented Generation），目前是构建智能问答的重要技术。RAG相比传统的检索可以可以减少幻觉；支持知识动态更新等优点，是现在企业和个人打造知识库的重要架构和技术。核心包括以下2点：

1、数据准备阶段

包括：数据收集及清洗——>文本解析及分割——>文本转化成向量——>数据入库

2、应用阶段

包括：用户提问——>问题解析——>数据检索（召回和重排）——>注入Prompt——>LLM生成答案

二、RAG构建智能问答系统详解

以下是RAG技术构建智能问答平台业务流程图：

一）数据准备阶段

1、数据收集及清洗

企业需要建立自己的知识库，根据企业业务进行分类，建议设置版主进行运营，毕竟没有更新的知识是没用的。同时也可以去收集各个业务系统的数据，包括钉钉的发文、项目管理系统等知识。下图是根据业务构建知识库架构和流程：

知识包括非结构化（各类文档，如：Word、PDF、Excel等）和结构化的知识（Excel、数据库知识等）。

收集了知识后，对部分数据进行清洗，去除冗余和噪音。包括去除重复文档、去除过时的旧文档等。特别同一份知识，经常存在新旧版本，要记得把旧版本删除。

2、文本解析及分割

1）文件解析

文件解析是将原始文件（如 PDF、Word、Markdown、表格等）转换为转换为纯文本或结构化文本。文件解析技术包括：基于空间布局的技术（MinerU）、多模态技术。

2）文件分割

大模型的输入长度有限，且长文本不利于精准检索，因此需要将原始文本分割为较小的 “块”（Chunks）。

分割策略包括按固定大小分割和按语义分割。最初我们是按固定大小分割，发现效果不太好，后续按语义单元进行分割，效果好很多。在分割时由于会丢失上一级标题，影响检索效果，建议把上一级标题自动加上。

3、把文本转化成向量

RAG 的 “检索” 环节依赖向量数据库，需将文本块转换为向量（Embedding）并存储，以便快速匹配相似内容。

选择开源模型，把文本转成向量，目前有conan-embedding-v1、bge-m3 等模型。经过对比和测试发现bge-m3模型比较好。

4、数据入库

转成向量后，存储到向量数据库。根据不同内容建了DOC库和QA库。所有文档放到DOC库，如果有问答对，放到QA库。QA库是简短的一问一答知识列表，优先级会比DOC库优先。

二）应用阶段

1、用户提问

在所有需要问答的页面，我们都可以设计智能问答入口，引导用户提问。目前交互基本都是千篇一律。如下是豆包交互。

2、问题解析

由于存在上下文，需要对用户多轮会话进行改写，得出用户真正要问的问题。如果智能问答平台不只是问答，要能实现问生产系统的内容，那还要去对问题进行意图识别，语法分析、实体识别等步骤。

3、数据检索

包括知识检索、知识召回、知识重排与生成、注入Prompt

1）知识检索

将用户问题通过 Embedding 模型转为向量，在向量数据库中搜索与该向量相似度最高的 Top N 个 Chunk（如 Top 5）。为了解决向量模型对专业术语不敏感的问题，还会引入关键词检索。即 向量检索+关键词检索

2）知识召回

从检索到的文档中，提取出相关的句子或段落，作为候选答案。

3）知识重排与生成

使用算法，把所有检索的结果进行排序。这里涉及到答案评分，使用模型对答案进行评分，评分高的排前面，获得重排的答案。

4）注入Prompt

我们提前准备了一段通用的Prompt，基于提供的知识回答问题，不编造信息，让他按我们的要求输出答案，例如我们构建如下Prompt：

5）LLM生成答案

通过模型，和注入Prompt，让模型对候知识进行总结。国内可以选择DeepSeek V3、Deepseek R1、Qwen等模型进行总结。建议试用DeepSeek V3。

以上就用RAG 技术构建智能问答平台的基本流程，为了提升用户体验，我们也可以引入定量指标和定性反馈评估系统性能（包括检索精度、生成准确性、用户满意度、响应速度等指标），并持续优化。

普通人如何抓住AI大模型的风口？

领取方式在文末

为什么要学习大模型？

目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用，大模型作为其中的重要组成部分，正逐渐成为推动人工智能发展的重要引擎。大模型以其强大的数据处理和模式识别能力，广泛应用于自然语言处理、计算机视觉、智能推荐等领域，为各行各业带来了革命性的改变和机遇。

目前，开源人工智能大模型已应用于医疗、政务、法律、汽车、娱乐、金融、互联网、教育、制造业、企业服务等多个场景，其中，应用于金融、企业服务、制造业和法律领域的大模型在本次调研中占比超过 30%。
在这里插入图片描述

随着AI大模型技术的迅速发展，相关岗位的需求也日益增加。大模型产业链催生了一批高薪新职业：
在这里插入图片描述

人工智能大潮已来，不加入就可能被淘汰。如果你是技术人，尤其是互联网从业者，现在就开始学习AI大模型技术，真的是给你的人生一个重要建议！

最后

只要你真心想学习AI大模型技术，这份精心整理的学习资料我愿意无偿分享给你，但是想学技术去乱搞的人别来找我！

在当前这个人工智能高速发展的时代，AI大模型正在深刻改变各行各业。我国对高水平AI人才的需求也日益增长，真正懂技术、能落地的人才依旧紧缺。我也希望通过这份资料，能够帮助更多有志于AI领域的朋友入门并深入学习。

真诚无偿分享！！！
vx扫描下方二维码即可
加上后会一个个给大家发
在这里插入图片描述

大模型全套学习资料展示

自我们与MoPaaS魔泊云合作以来，我们不断打磨课程体系与技术内容，在细节上精益求精，同时在技术层面也新增了许多前沿且实用的内容，力求为大家带来更系统、更实战、更落地的大模型学习体验。

希望这份系统、实用的大模型学习路径，能够帮助你从零入门，进阶到实战，真正掌握AI时代的核心技能！

01 教学内容

从零到精通完整闭环：【基础理论 →RAG开发 → Agent设计 → 模型微调与私有化部署调→热门技术】5大模块，内容比传统教材更贴近企业实战！
大量真实项目案例： 带你亲自上手搞数据清洗、模型调优这些硬核操作，把课本知识变成真本事‌！

02适学人群

应届毕业生‌： 无工作经验但想要系统学习AI大模型技术，期待通过实战项目掌握核心技术。

零基础转型‌： 非技术背景但关注AI应用场景，计划通过低代码工具实现“AI+行业”跨界‌。

业务赋能突破瓶颈： 传统开发者（Java/前端等）学习Transformer架构与LangChain框架，向AI全栈工程师转型‌。

vx扫描下方二维码即可
在这里插入图片描述

本教程比较珍贵，仅限大家自行学习，不要传播！更严禁商用！

03 入门到进阶学习路线图

大模型学习路线图，整体分为5个大的阶段：

04 视频和书籍PDF合集

从0到掌握主流大模型技术视频教程（涵盖模型训练、微调、RAG、LangChain、Agent开发等实战方向）

新手必备的大模型学习PDF书单来了！全是硬核知识，帮你少走弯路（不吹牛，真有用）

05 行业报告+白皮书合集

收集70+报告与白皮书，了解行业最新动态！

06 90+份面试题/经验

AI大模型岗位面试经验总结（谁学技术不是为了赚$呢，找个好的岗位很重要）
在这里插入图片描述

07 deepseek部署包+技巧大全

在这里插入图片描述

由于篇幅有限

只展示部分资料

并且还在持续更新中…

真诚无偿分享！！！
vx扫描下方二维码即可
加上后会一个个给大家发
在这里插入图片描述

您可能感兴趣的与本文相关的镜像

Llama Factory

模型微调

LLama-Factory

LLaMA Factory 是一个简单易用且高效的大型语言模型（Large Language Model）训练与微调平台。通过 LLaMA Factory，可以在无需编写任何代码的前提下，在本地完成上百种预训练模型的微调