机器学习笔记 - Facebook AI Similarity Search(Faiss)简介

本文介绍了Facebook AI的Faiss库,用于高效相似性搜索和向量聚类。通过创建数据、向量转换、构建FAISS索引、搜索与排序,展示了如何利用Faiss进行文本向量的检索。同时提到了其他开源向量检索引擎如Milvus、Jina AI、Proxima和Vearch。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、概述

        Facebook AI Similarity Search (Faiss)是高效相似性搜索最受欢迎的轮子之一。给定一组向量,我们可以使用 Faiss 对它们进行索引——然后使用另一个向量(查询向量),我们在索引中搜索最相似的向量。

        它包含搜索任何大小的向量集的算法,除非超出RAM的大小。它还包含用于评估和参数优化的支持代码。Faiss 是用 C++ 编写的,带有 Python/numpy 的完整包装器。一些最有用的算法是在 GPU 上实现的。它主要由 Meta 的基础 AI 研究小组开发。

         Faiss可以让我们构建索引和搜索,而且搜索时间还飞快。Faiss 已经为十亿级数据集构建了最近邻搜索实现,并且在1亿个高维向量上构建了k最近邻图。

1、词嵌入或向量 

        向量或嵌入是文本数据的数值表示形式。例如,使用嵌入框架,像“name”这样的文本可以转换为数字表示,如下所示:

[-1.12725616e-01 -5.19371144e
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

坐望云起

如果觉得有用,请不吝打赏

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值