常用向量检索组件收集-持续更新中-大家推荐

部署运行你感兴趣的模型镜像

一。Milvus

Milvus 是 一款开源的、针对海量特征向量的相似性搜索引擎。Milvus能够很好地应对海量向量数据,它集成了目前在向量相似性计算领域比较知名的几个开源库(Faiss, SPTAG等),通过对数据和硬件算力的合理调度,以获得最优的搜索性能。

二。Faiss - 高维向量相似度检索和聚类库

Facebook 开源的一个高性能的高维向量相似度检索和聚类库。
开源协议之前采用 BSD + Patents。最新版 v1.5.2 采用 MIT,可以在商业软件中使用。
github 上有 6000 多 Stars。


Faiss 主要特性:

  • 支持相似度检索和聚类;
  • 支持多种索引方式;
  • 支持CPU和GPU计算;
  • 支持Python和C++调用;

Faiss 索引类型:

  • Exact Search for L2 #基于L2距离的确定搜索匹配
  • Exact Search for Inner Product #基于内积的确定搜索匹配
  • Hierarchical Navigable Small World graph exploration #分层索引
  • Inverted file with exact post-verification #倒排索引
  • Locality-Sensitive Hashing (binary flat index) #本地敏感hash
  • Scalar quantizer (SQ) in flat mode #标量量化索引
  • Product quantizer (PQ) in flat mode #笛卡尔乘积索引
  • IVF and scalar quantizer #倒排+标量量化索引
  • IVFADC (coarse quantizer+PQ on residuals) #倒排+笛卡尔乘积索引
  • IVFADC+R (same as IVFADC with re-ranking based on codes) #倒排+笛卡尔乘积索引 + 基于编码器重排

第1个和第2个索引方式是属于精确匹配,其他索引方式都是通过数据压缩的非精确匹配。
虽然采用压缩索引方式导致少量精度损失,但大大减少了内存占用,从而支持在超大规模数据集上进行相似度检索,比如在单机上支持10亿规模的高维向量检索。


Faiss 使用场景:
最常见的人脸比对,指纹比对,基因比对等。


Faiss 开发资料:
github: https://github.com/facebookresearch/faiss
tutorial: https://github.com/facebookresearch/faiss/wiki/Getting-started

三 .Vearch

 

您可能感兴趣的与本文相关的镜像

ACE-Step

ACE-Step

音乐合成
ACE-Step

ACE-Step是由中国团队阶跃星辰(StepFun)与ACE Studio联手打造的开源音乐生成模型。 它拥有3.5B参数量,支持快速高质量生成、强可控性和易于拓展的特点。 最厉害的是,它可以生成多种语言的歌曲,包括但不限于中文、英文、日文等19种语言

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值