[Milvus Vector Database: Mastering Embedding Management for Scalable AI Applications]

最新推荐文章于 2025-12-03 13:04:04 发布

原创

最新推荐文章于 2025-12-03 13:04:04 发布 · 530 阅读

4 ·

CC 4.0 BY-SA版权

文章标签：

#milvus #数据库 #embedding #python

Milvus Vector Database: Mastering Embedding Management for Scalable AI Applications

引言

在现代AI应用中，向量嵌入（vector embeddings）已成为一个不可或缺的组成部分。Milvus是一个专门用于存储、索引和管理大规模嵌入向量的数据库，越来越受到开发者的关注。本文旨在介绍如何使用Milvus进行向量存储和检索，以实现高效的AI应用开发。

主要内容

设置和初始化

要使用Milvus的功能，首先需要安装相关Python包：

pip install -qU langchain-milvus langchain-openai langchain-huggingface langchain-core

Milvus提供一个轻量级的Milvus Lite版本，适合原型设计。如果你的数据规模超过百万条文档，建议在Docker或Kubernetes上搭建一个更高性能的Milvus服务器。

嵌入初始化

可以使用OpenAI或HuggingFace的嵌入模型来生成向量：

import os
from langchain_openai import OpenAIEmbeddings
from langchain_huggingface import HuggingFaceEmbeddings
from langchain_core.embeddings import FakeEmbeddings

# 初始化OpenAI嵌入
embeddings_openai = OpenAIEmbeddings

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

sfewyrtwjw

关注关注

4
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

【异常】Attu链接提示错误Error: Failed to connect to Milvus: Error: 14 UNAVAILABLE: No connection established

本本本添哥

02-06

2242

遇到 Attu 提示错误，通常意味着 Attu 客户端尝试连接到 Milvus 服务时失败了。这个错误可能由多种原因造成，下面将详细分析一些常见的原因及其解决方法。

Milvus ConnectionRefusedError: how to connect locally

suiusoar

07-02

2029

怎样在本地连接到 Milvus 数据库。连接 Milvus 数据库被拒绝的错误

参与评论您还未登录，请先登录后发表或查看评论

【Milvus】向量索引（Vector Index）的类型：内存索引、磁盘索引和 GPU 索引

彬彬侠的博客

04-26

1608

Milvus 向量数据库支持多种向量索引类型，旨在优化高维向量数据的相似性搜索（ANN，近似最近邻搜索）。这些索引类型根据存储介质和计算硬件的不同，分为内存索引、磁盘索引和 GPU 索引，每种索引针对特定场景（如精度、速度、内存占用或硬件支持）进行了优化。内存索引（如 HNSW、IVF_FLAT）适合高性能场景，磁盘索引（DiskANN）适合超大规模数据，GPU 索引（GPU_CAGRA、GPU_IVF_PQ）适合高吞吐量应用。稀疏索引（如 SPARSE_INVERTED_INDEX）优化了关键词搜索，

Milvus向量数据库

weixin_44490884的博客

05-30

8990

Milvus创建于2019年，唯一的目标是：存储、索引和管理由深度神经网络和其他机器学习(ML)模型生成的大量嵌入向量embedding vectors。

一文带你入门向量数据库milvus：含docker安装、milvus安装使用、attu 可视化，完整指南启动 Milvus 进行了向量相似度搜索

热门推荐

丨汀、的博客

07-21

4万+

一文带你入门向量数据库milvus：含docker安装、milvus安装使用、attu 可视化，完整指南启动 Milvus 进行了向量相似度搜索

Milvus向量数据库 --- 01 基本词汇概念

小菜鸟正洋洋的博客

05-25

2273

Vector：在Milvus中，Vector是指向量数据的一种数据类型，它是由多个数值组成的数组，每个数值表示向量在一个维度上的取值。Schema：Milvus向量数据的库的Schema是指向量数据的模式定义，包括向量的维度、向量数据类型、索引类型等。Index：在Milvus中，Index是指对向量数据进行预处理和优化的技术，可以大大提高向量数据的查询效率。Milvus支持多种不同的查询方法，包括向量相似度查询、范围查询等，用户可以根据不同的应用场景选择不同的查询方法。

Milvus向量库安装部署

wangqiaowq的博客

02-19

7931

1、安装Standstone 版本。

Vector Database 对比：FAISS vs. Milvus vs. Weaviate

2301_82242835的博客

02-20

226

【代码】Vector Database 对比：FAISS vs. Milvus vs. Weaviate。

RAG + Milvus 实战指南：打造高性能 AI 知识检索与问答系统

weixin_38839402的博客

08-17

2141

RAG与Milvus结合构建智能问答系统：大语言模型(LLM)存在知识静态化问题，RAG技术通过检索增强生成实现了实时知识更新和私有数据接入。作为开源向量数据库，Milvus凭借毫秒级检索、多模态支持和可扩展性成为RAG的理想检索组件。文章详细解析了RAG+Milvus的技术原理、系统架构和实战部署方法，包括数据向量化、索引选择及性能优化技巧，并展望了多模态RAG等未来发展方向。该组合有效解决了LLM的知识局限问题，为构建可靠的知识问答系统提供了解决方案。

精选资源

7-2+Milvus+Towhee：向量数据库及embedding流水线.pdf

03-18

【Embedding流水线】：在人工智能驱动的数据搜索和分析中，Embedding是将非结构化数据转化为潜在语义表示的关键步骤。例如，在文本分析中，通过词嵌入技术（如Word2Vec或BERT），可以将单词或句子转换为向量，这些...

Chroma与Milvus向量数据库：从入门到实战应用3

09-08

向量数据库主要用于机器学习和人工智能领域，尤其在需要进行向量相似度搜索的场景中，例如图像识别、自然语言处理、推荐系统等。 Chroma作为一个开源的向量数据库，它提供了易于使用的API和灵活的数据管理能力。它...

Milvus创建集合报multiple vector fields is not supported

離殇

04-28

2218

创建milvus集合的时候milvus报如下错误 multiple vector fields is not supported <SchemaNotReadyException: (code=0, message=No vector field is found.)> 看了官方的API之后才知道在创建集合的时候必须要指定一个矢量场，可以指定的类型分别是： DataType.BINARY_VECTOR DataType.FLOAT_VECTOR 第一个表示二进制向量第二个表示浮点向量

火山引擎向量数据库 Milvus 版正式商业化：AI 时代的向量检索新标杆

volcenginetod的博客

12-01

416

数据堆成了山，却像乱码一样没法用”——这是当下不少企业在AI浪潮中的共同窘境。当大模型像潮水般涌入业务，文本、图像、音频这些“不规则”的非结构化数据，正以每天数十亿条的速度疯狂增长，IDC给出了更详细的数据：2025 年，全年新产生的数据中将有 90% 是非结构化数据，它们本该是企业的“金矿”，却因传统工具“读不懂、查不快、管不好”，沦为食之无味的“数据鸡肋”——只有 18% 的企业机构认为他们有效地利用了非结构化数据。

基于VGG16+Milvus的以图搜图系统实现教程

有问题联系我qq：270490096

12-01

582

本项目通过VGG16模型实现高效特征提取，结合Milvus向量数据库的快速检索能力，构建了一套完整的以图搜图系统。Docker容器化部署确保了环境一致性，Flask+jQuery简化了前后端开发流程。系统可直接用于小型图片库检索，通过微调模型与优化配置，也可扩展至百万级图片库场景。

GraphRAG-2.7.0整合Milvus-2.5.1

优快云_Crazy_app的博客

12-01

288

本文介绍了如何扩展微软GraphRAG项目以支持Milvus向量数据库。主要内容包括：1. 通过新增MilvusVectorStore类继承BaseVectorStore基类，实现Milvus连接、文档加载和向量搜索功能；2. 修改配置文件和枚举类，新增Milvus向量存储类型；3. 提供完整的代码实现方案，包括索引构建、文档查询等核心功能；4. 展示实际查询示例，验证Milvus集成效果。该方案成功将Milvus作为新的向量存储选项集成到GraphRAG框架中，为开发者提供了更多向量数据库选择。

零基础学AI大模型之Milvus实战：Attu可视化安装+Python整合全案例

chandfy的博客

12-01

1003

本文介绍了AI大模型实战系列文章，重点分享Milvus向量数据库的Attu可视化工具安装与Python整合案例。Attu作为官方开源的图形化管理工具，提供跨平台支持、数据库全生命周期管理、向量检索等核心功能。文章详细讲解Attu的安装部署流程（包括Docker方式），并给出Python代码示例展示集合创建、数据插入和相似度查询的完整操作链路。该教程适合零基础开发者快速掌握Milvus的实战应用，降低学习门槛。

【大模型杂货铺】阿里云服务器 Milvus 极简安装教程

ll1042668699的博客

11-30

953

安装 Docker 环境 → 配置 Docker 核心参数 → 开放端口 → 部署 Milvus → 部署 Attu

MySQL数据库的数据文件保存在哪？MySQL数据存在哪里

2509_94083514的博客

11-30

782

在安装好MySQL数据库使用一段时间后，会产生许多的数据库和数据。那这些数据库的数据文件存放在本地文件夹的什么位置呢一、默认位置MySQL创建的数据库实际上存储在文件系统的一个特定目录中，该目录通常为MySQL的数据目录。这个目录的默认位置依据操作系统和MySQL的安装方式不同而有所差异。、这个目录通常位于，它可能位于是个隐藏文件夹）**其中“X.X”是MySQL的版本号。目录（每个数据库都有一个与其同名的文件夹，而这个文件夹中包含了该数据库的所有表的文件，而其中的文件代表了数据库中的表。

【免费云平台部署指南】按场景选型+全维度对比（附直达地址）

最新发布

分享技术干货，聚焦AI前沿科技

12-03

815

免费云平台已能覆盖从静态网站到AI模型部署的大部分场景，核心是根据项目类型（静态/后端/AI）、访问地区（国内/国外）和功能需求（数据库/容器/GPU）选择适配平台。新手建议从简单场景入手（如GitHub Pages部署博客、Hugging Face Spaces部署AI Demo），熟悉后再尝试全栈或容器化部署。

milvus-standalone:19530

02-06

Milvus 是一款开源的向量相似度搜索引擎，广泛用于推荐系统、图像搜索等场景。`milvus-standalone:19530` 指的是 Milvus 单机版服务运行在端口 19530 上的情况。 ### 关于 Milvus Standalone **单机版（Standalone）** 的 Milvus 部署相对简单，适用于开发测试环境或小规模应用。它集成了所有必要的组件，如存储引擎、计算资源管理等，都部署在同一台机器上。 #### 端口号解释 - **19530**: 这是 Milvus 默认的服务监听端口，客户端通过这个端口与 Milvus Server 进行通信，发送查询请求和接收结果。当你看到 `milvus-standalone:19530`，意味着你可以通过主机名加上此端口号来访问正在运行的 Milvus 实例。例如： ```bash grpc://localhost:19530 ``` ### 启动 Milvus Standalone 假设你已经安装了 Docker 和 Docker Compose，启动 Milvus 单机版非常容易： ```bash docker run -d --name milvus_standalone -p 19530:19530 -p 8081:8081 \ registry.cn-hangzhou.aliyuncs.com/milvusdb/milvus:v2.0-cpu-d061721-5e559c \ /bin/bash -c "ulimit -n 4096 && ./scripts/run_milvus.sh" ``` 这里 `-p 19530:19530` 表示将容器内部的 19530 端口映射到宿主机器相同的端口上；而另一个 `-p 8081:8081` 则是用来提供 Web UI 访问，默认情况下 Web 控制面板也是可用的。 ### 客户端连接为了从应用程序中连接到 Milvus，你需要指定正确的服务器地址和端口。比如使用 Python SDK PyMilvus 来插入数据点并创建索引时，可能会像这样初始化客户端实例： ```python from pymilvus import connections, FieldSchema, CollectionSchema, DataType, Collection connections.connect("default", host="localhost", port="19530") fields = [ FieldSchema(name="id", dtype=DataType.INT64, is_primary=True), FieldSchema(name="embedding", dtype=DataType.FLOAT_VECTOR, dim=128) ] schema = CollectionSchema(fields) collection_name = "example_collection" # 创建集合 Collection(name=collection_name, schema=schema).create_index(field_name="embedding") ``` ---