Faiss 是 Facebook AI 研究院开发的一种高效的相似性搜索和聚类库,能够快速处理大规模数据,并支持在高维空间中进行相似性搜索。以下是 Faiss 的搭建与使用步骤:
安装 Faiss:
首先,需要在系统上安装 Faiss。它支持 Linux、macOS 和 Windows 操作系统,可以通过 Python 的 pip 包管理器进行安装。在终端中输入以下命令:
pip install faiss-cpu
如果你的系统有 NVIDIA 的 GPU 并且已经安装了 CUDA,你可以选择安装支持 GPU 的版本:
pip install faiss-gpu
基本使用示例:
1、导入所需库:
import numpy as np
import faiss
2、生成随机数据作为向量数据库:
d = 128 # 维度
nb = 10000 # 数据库大小
np.random.seed(1234) # 使结果可重复
xb = np.random.random((nb, d)).astype('float32')
3、创建索引(这里使用最简单的 L2 距离索引):
index = faiss.indexflatl2(d) # 构建索引
print(index.is_trained)
4、将数据添加到索引中:
index.add(xb) # 添加向量到索引
print(index.ntotal)
5、生成查询向量并进行搜索:
nq = 5 # 查询向量数量
k = 4 # 想要的相似向量数量
xq =

最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



