第三周-第四周:文本向量化及向量库搜索研究
Faiss向量数据库搭建初览
参考:向量数据库-Faiss详解 - 知乎 (zhihu.com)
向量数据库Faiss是Facebook AI研究院开发的一种高效的相似性搜索和聚类的库。它能够快速处理大规模数据,并且支持在高维空间中进行相似性搜索。
安装faiss向量数据库:
conda create -n faiss
conda activate faiss
#pip install faiss-cpu
#GPU版本
#pip install faiss-gpu
conda install -c conda-forge faiss-cpu
导入faiss向量数据库
import numpy as np
import faiss
随机数据作为向量数据库
d = 128 # dimension
nb = 10000 # database size
np.random.