你应该懂的AI大模型（三）之 RAG

最新推荐文章于 2025-07-08 20:23:32 发布

原创最新推荐文章于 2025-07-08 20:23:32 发布 · 1.1k 阅读

11 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能 #机器学习 #本地化部署 #程序员 #知识库 #自然语言处理

部署运行你感兴趣的模型镜像

从本篇开始笔者会尽量多使用一些英文缩写和单词，不是笔者为了装X，是为了大家在后面遇到的时候不至于被别人装到。

一、什么是RAG

1.1 大模型的局限性

大模型的知识不是实时的，比如现在《藏海传》已经完结了，但是我问deepseek给我的回答却是：

除了知识不是实时的之外，大模型可能也不知道你当前所在业务领域的知识。这就是大模型目前所固有的局限性。

1.2 检索增强生成

为了解决大模型所固有的局限性，就有了 RAG（Retereval Augmented Generation），通过检索的方法来增强模型的能力。

ps：笔者不知道哪种读法是对的，有的读 RAG 的英文字母，笔者有认识的大佬读[ræɡ]，即 ruai ge，笔者觉着跟随者大佬读应该更能装到。）

我们现在使用的 LLM（Large Language Model）是通过海量文本数据训练得来，能够理解和生成人类语言。也就是说当我们问大模型问题的时候大模型会从它先有的知识中得出答案回答我们，但是如果我们问一些时事或者专业领域问题的时候大模型没有这部分知识，那么大模型就有可能会自由发挥来回答我们问题，因此我们引入 RAG 相当于给大模型进行一场开卷考试，当我们问问题的时候，大模型会“先翻书”再回答问题。

其实这就相当于给LLM戴上了紧箍咒。强制要求回答问题必须从给定的知识库中检索到的内容生成答案，不让LLM凭空想象捏造答案，大大降低了模型出现幻觉的概率。

二、RAG系统的基本搭建流程

在上图中有两个比较新的东西，一个是Embedding模型和VectorDB，解释以下这两个概念：

Embedding模型，即嵌入式模型，它的作用是将非结构化的数据（如文本、图像、音频）转换成可计算的数值向量；
Vector DB：向量数据库，顾名思义可以理解为存储Embedding生成的向量数据的数据库。

抛开这两个概念，RAG搭建的过程可以总结为以下四步：

1、文档加载，按照一定的条件和规则将文档切割成片段；

2、将切割的文本片段灌入检索引擎；

3、封装检索接口；

4、构建调用流程：Query->检索->Prompt->LLM->回复

三、向量检索

3.1、什么是向量

向量是一种有大小和方向的数学对象。它可以表示为从一个点到另一个点的有向线段。例如，二维空间中的向量可以表示为 (x,y)，表示从原点 (0,0) 到点 (x,y) 的有向线段。

从数学的角度看，向量是一个“有方向和大小的东西”，可以用数字坐标来描述。在计算机世界中，我们可以把向量简单地理解为一组“有意义的数字”，用来表示事物的特征。

例如我们描述一只猫的可以描述为有胡须、有毛、会喵喵叫，这些信息转换成向量就可以用一堆数字来表述[有胡须：0.981，有毛：0.193，会喵喵叫：0.453]，每个数字都代表一个特征，这样猫的特性就被向量化了，就能被计算机检索出来。

文本向量就是将文本转成一组N维的浮点数，即文本向量又叫Embeddings，向量之间可以计算距离，距离的远近对应语义相似度的大小。

PS：文本向量是怎么计算得到的，这不是本文能讲解明白的，不是笔者不想写，是想要把这个话题拿来写着实是有点难度。

3.2、向量间的相似度计算

向量的相似性通常通过计算向量之间的距离来比较。距离越小，相似性越高。常用的算法比如余弦距离和欧式距离来判断向量距离。

假设我们有两个文本的向量：

文本1：“我感冒了” → 向量为 [0.82, 0.61, 0.97]

文本2：“我流感了” → 向量为 [0.90, 0.73, 0.98]

通过余弦相似度公式计算余弦相似性，结果越接近1，说明两个文本的语义高度相似。

欧氏距离：越小越相似。

余弦距离：越大越相似，余弦值越大夹角越小，距离越近。

3.3、向量数据库

Embedding Modle（嵌入模型）负责计算向量，向量数据库负责存储和比较向量。向量数据库是专门为向量检索设计的中间件！

读到这里大家可能会觉着向量数据真厉害，简直可以秒杀传统的关系型数据库，在这里告诉大家：

向量数据库的意义是快速的检索；
向量数据库本身不生成向量，向量是由 Embedding 模型产生的；
向量数据库与传统的关系型数据库是互补的，不是替代关系，在实际应用中根据实际需求经常同时使用。

大家不要盲目迷信学习大模型我们带来的新的技术视野。

下面为大家列举几个常见的向量数据库，这些向量数据库的特点大家可自行总结：

Chroma
Deep Lake (Activeloop)
Elasticsearch & OpenSearch（没想到吧，Elasticsearch也支持向量检索）
Faiss (Facebook AI Similarity Search)
LanceDB
Milvus
Pinecone
PgVector (PostgreSQL 扩展)
Qdrant
ScaNN (Scalable Nearest Neighbors)

3.4、认识几个Embedding模型

建议大家去HuggingFace上瞅瞅吧。。。正好不知道的同学可以了解下HuggingFace是啥，除了HuggingFace还可以逛逛阿里的魔塔社区。

四、其他可以装到的话题

4.1、企业中落地RAG常用的向量数据库

milvus和Qdrant。

4.2、大模型的两个流派

RAG派和上下文窗口扩大派，这两派的论调大家自行搜索查看就好。

在笔者看来，目前做项目能够简单落地的还就是RAG。

4.3、Hybird Search 混合检索

在实际生产中，传统的关键字检索（稀疏表示）与向量检索（稠密表示）各有优劣。举个具体例子，比如文档中包含很长的专有名词，关键字检索往往更精准而向量检索容易引入概念混淆。所以，有时候我们需要结合不同的检索算法，来达到比单一检索算法更优的效果。这就是混合检索。

4.4、处理PDF文档中的表格

PDF中的表格我们怎么处理抽取，大家放心，我们能遇到的问题，大佬们肯定早就碰到了，因此有很多面向RAG的文档解析辅助工具：

PyMuPDF: PDF 文件处理基础库，带有基于规则的表格与图像抽取（不准）
RAGFlow: 一款基于深度文档理解构建的开源 RAG 引擎，支持多种文档格式（火爆）
Unstructured.io: 一个开源+SaaS形式的文档解析库，支持多种文档格式
LlamaParse：付费 API 服务，由 LlamaIndex 官方提供，解析不保证100%准确，实测偶有文字丢失或错位发生
Mathpix：付费 API 服务，效果较好，可解析段落结构、表格、公式等，贵！

五、GraphRAG

通过知识图谱来增减检索，即在检索中利用图谱的关联性捕捉深层语义，弥补依赖向量相似度的不足。特点是小公司玩不起，都是大公司在玩。

如何系统的去学习大模型LLM ？

大模型时代，火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。 “AI会取代那些行业？”“谁的饭碗又将不保了？”等问题热议不断。

事实上，抢你饭碗的不是AI，而是会利用AI的人。

继科大讯飞、阿里、华为等巨头公司发布AI产品后，很多中小企业也陆续进场！超高年薪，挖掘AI大模型人才！ 如今大厂老板们，也更倾向于会AI的人，普通程序员，还有应对的机会吗？

与其焦虑……

不如成为「掌握AI工具的技术人」，毕竟AI时代，谁先尝试，谁就能占得先机！

但是LLM相关的内容很多，现在网上的老课程老教材关于LLM又太少。所以现在小白入门就只能靠自学，学习成本和门槛很高。

基于此，我用做产品的心态来打磨这份大模型教程，深挖痛点并持续修改了近70次后，终于把整个AI大模型的学习门槛，降到了最低！

在这个版本当中：

第一您不需要具备任何算法和数学的基础
第二不要求准备高配置的电脑
第三不必懂Python等任何编程语言

您只需要听我讲，跟着我做即可，为了让学习的道路变得更简单，这份大模型教程已经给大家整理并打包，现在将这份 LLM大模型资料 分享出来：包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等, 😝有需要的小伙伴，可以 扫描下方二维码领取🆓↓↓↓

一、LLM大模型经典书籍

AI大模型已经成为了当今科技领域的一大热点，那以下这些大模型书籍就是非常不错的学习资源。

在这里插入图片描述

二、640套LLM大模型报告合集

这套包含640份报告的合集，涵盖了大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。(几乎涵盖所有行业)
在这里插入图片描述

三、LLM大模型系列视频教程

在这里插入图片描述

四、LLM大模型开源教程（LLaLA/Meta/chatglm/chatgpt）

在这里插入图片描述

五、AI产品经理大模型教程

在这里插入图片描述

LLM大模型学习路线 ↓

阶段1：AI大模型时代的基础理解

目标：了解AI大模型的基本概念、发展历程和核心原理。
内容：
- L1.1 人工智能简述与大模型起源
- L1.2 大模型与通用人工智能
- L1.3 GPT模型的发展历程
- L1.4 模型工程
- L1.4.1 知识大模型
- L1.4.2 生产大模型
- L1.4.3 模型工程方法论
- L1.4.4 模型工程实践
- L1.5 GPT应用案例

阶段2：AI大模型API应用开发工程

目标：掌握AI大模型API的使用和开发，以及相关的编程技能。
内容：
- L2.1 API接口
- L2.1.1 OpenAI API接口
- L2.1.2 Python接口接入
- L2.1.3 BOT工具类框架
- L2.1.4 代码示例
- L2.2 Prompt框架
- L2.3 流水线工程
- L2.4 总结与展望