向量库入门指南：从原理到实际部署

最新推荐文章于 2025-09-06 09:54:12 发布

原创最新推荐文章于 2025-09-06 09:54:12 发布 · 943 阅读

CC 4.0 BY-SA版权

文章标签：

165 篇文章

订阅专栏

从语义检索到 RAG，再到多模态搜索，向量数据库已经成为 AI 应用时代的“新型搜索引擎”。这篇文章，我们不讲玄学，只讲实战。

进入大模型时代之后，你会发现一个现象：原来的关键词搜索越来越跟不上需求了。比如你想做一个知识问答系统，用户问的是“请问年假最多能休几天”，而数据库里写的是“年假制度依据劳动法第三十八条规定，员工满一年可享受……”，这时候传统的关键词匹配根本抓不住语义。

这就是向量库出场的时刻。它能把文本、图片、音频、代码等各种内容转成“语义向量”，用“相似度”而不是“字面吻合”来做检索。这种检索方式，叫近似最近邻检索（ANN, Approximate Nearest Neighbor），而承载它的，就是我们说的向量数据库。

一句话总结：有了大模型，才有了对语义检索的需求；有了语义检索，才离不开向量库。

我们以最常见的文本为例。

当你用一个嵌入模型（比如 text-embedding-3-small）处理一句话时，它会返回一个维度可能是 384、768 或 1536 的向量。这个向量是一个稠密浮点数组，代表了这句话在语义空间里的位置。

比如：

“年假多少天” → [0.012, -0.345, ..., 0.021]
“请问我可以休几天年假” → [0.015, -0.342, ..., 0.025]

这两条语句在高维空间中“挨得很近”，所以我们说它们语义相似。

向量检索的核心问题就是：给定一个查询向量，快速在几百万甚至亿级数据中找到“最相近”的向量。这背后的算法，主要有几类：

一般来说，如果你想做文本语义搜索，或者构建一个 RAG 检索系统，选 PQ+IVF 或 HNSW 就很够用了。

现在主流的向量库很多，但真正用得多的还是这两大派：轻量本地派（以 FAISS 为代表） 和 分布式企业派（以 Milvus 为代表）。

FAISS 全称 Facebook AI Similarity Search，是一个 C++ 写的、带 Python 接口的高效库。它支持 IVF、PQ、HNSW 等多种算法，适合在单机/单节点场景下快速构建索引。优点是轻、快、灵活，几百行代码就能构建一个嵌入检索系统。

适合场景：

缺点：

Milvus 是 Zilliz 团队开源的向量数据库，支持亿级规模、分布式部署、冷热数据管理、混合索引、RESTful API、用户权限等功能，非常适合生产环境使用。底层检索算法也支持 IVF、HNSW、DiskANN 等，扩展性比 FAISS 强很多。

适合场景：

缺点是部署稍重，学习曲线相对更陡。但如果你要做一个团队级/企业级检索系统，Milvus 是非常靠谱的选择。

接下来聊聊实际落地。如果你现在手上有一批文本数据，想做一个“语义搜索+问答系统”，你可以这样搭建你的向量库 pipeline：

graph TD
A[原始文档] --> B[文本清洗 & 分段]
B --> C[嵌入模型] --> D[向量]
D --> E[向量库（FAISS/Milvus）]
E --> F[相似向量 Top-K 检索]
F --> G[大模型调用生成答案]

很多初学者一开始把向量库当成 SQL 数据库去用，想着能不能搞个 select * from vector where title like '%年假%'。但其实，向量库的本质是一种语义空间的索引系统，它无法直接理解字段、关系和条件，它理解的是“你这句话在语义上离谁最近”。

正因为如此，向量库是做 AI 系统的核心基建之一。无论是构建智能搜索、AI 助理、RAG 系统、AI 多模态检索，只要你涉及“理解”和“查找”的过程，向量库就一定在那背后默默支撑着。