Milvus 基本概念

最新推荐文章于 2025-06-16 20:27:21 发布

2629352674

最新推荐文章于 2025-06-16 20:27:21 发布

阅读量1k

点赞数 6

CC 4.0 BY-SA版权

分类专栏： milvus 文章标签： milvus 机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_56352553/article/details/136878306

Milvus 使用包含 java 和 python

知道特征向量是什么
Milvus 是向量数据库
- Collection 等价数据库的表
- Entity
- Field
- Segment 段
- 分片
- 分区
- 归一化
- 索引
- 向量

知道特征向量是什么

向量又称为 embedding vector，是指由embedding技术从离散变量（如xxx等各种非结构化数据）转变而来的连续向量。在数学表示上，向量是一个由浮点数或者二值型数据组成的 n 维数组。通过现代的向量转化技术，比如各种人工智能（AI）或者机器学习（ML）模型，可以将非结构化数据抽象为 n 维特征向量空间的向量。这样就可以采用最近邻算法（ANN）计算非结构化数据之间的相似度。

Milvus 是向量数据库

主要用于存储、索引和管理通过深度神经网络和机器学习模型产生的海量向量数据。

Collection 等价数据库的表

Collection 包含一组 entity。

Entity

实体包含一组 field

Field

field 与实际对象相对应。

Segment 段

Milvus 在数据插入时通过合并数据自动创建的数据文件。一个 collection 可以包含多个 segment。一个 segment 可以包含多个 entity。在搜索中，Milvus 会搜索每个 segment，并返回合并后的结果。

分片

将数据写入操作分散到不同节点上，使 Milvus 能充分利用集群的并行计算能力进行写入。默认情况下单个 collection 包含 2 个分片（shard）。目前 Milvus 采用基于主键哈希的分片方式，未来将支持随机分片、自定义分片等更加灵活的分片方式。

分区

把 collection 中的数据根据一定规则在物理存储上分成多个部分。这种对 c

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。