Vicinity：轻量级最近邻搜索，灵活的后端支持-优快云博客

本文链接：https://blog.youkuaiyun.com/gitblog_01089/article/details/147270962

Vicinity：轻量级最近邻搜索，灵活的后端支持

vicinity Lightweight Nearest Neighbors with Flexible Backends 项目地址: https://gitcode.com/gh_mirrors/vicin/vicinity

项目介绍

Vicinity 是一个轻量级、低依赖的向量存储库。它为最近邻搜索提供了简单直观的接口，并且支持多种后端和评估方式。在当前众多的最近邻搜索包和方法中，Vicinity 解决了不同包之间接口不统一、特性差异大以及难以评估的问题，为用户提供了统一的接口和便捷的评估手段。

项目技术分析

Vicinity 的核心是提供了一种简单且易于使用的最近邻搜索框架，它通过支持多种后端，使得用户可以轻松地根据需求选择最合适的索引方法和距离度量。这种设计使得 Vicinity 在不同场景下都能表现出良好的性能。

技术架构

轻量级设计：Vicinity 采用了最小化依赖的设计理念，以保持性能和易用性。
后端支持：它支持多种后端，如基本索引、HNSW、USEARCH、ANNOY、PYNNDESCENT、FAISS 和 VOYAGER 等，这些后端提供了不同的索引和搜索策略。
持久化存储：Vicinity 支持向量存储的序列化，可以方便地保存和加载向量库。
性能评估：它还提供了一个简单的性能评估工具，可以测量每秒查询数（QPS）和召回率。

代码示例

安装 Vicinity 非常简单：

pip install vicinity

下面是一个使用 Vicinity 进行最近邻搜索的代码示例：

import numpy as np
from vicinity import Vicinity, Backend, Metric

# 创建一些示例数据和向量
items = ["物品1", "物品2", "物品3", "物品4", "物品5"]
vectors = np.random.rand(len(items), 128)

# 初始化 Vicinity 实例
vicinity = Vicinity.from_vectors_and_items(
    vectors=vectors,
    items=items,
    backend_type=Backend.BASIC,
    metric=Metric.COSINE
)

# 创建查询向量
query_vector = np.random.rand(128)

# 查询最近邻
results = vicinity.query(query_vector, k=3)