引言
最近,基于近邻图的近似最近邻搜索算法(ANNS)取得了最优的效率和精度权衡。在图索引上,路径的单调性对相关ANNS算法的搜索性能起着至关重要的影响。几种当前最优的ANNS算法比如HNSW,NSG普遍能使搜索路径尽可能的单调递减,从而避免由于“绕远路”而降低搜索效率。本文介绍的几种proximity graphs是这些ANNS算法的基础,与当前的实用算法相比,这些proximity graphs有着严格的形式化定义,这给理论分析相关性质带来便利,从而也给实用的ANNS算法提供理论保证和优化方向。接下来,我们主要分析proximity graphs的单调性,proximity graphs包括德劳内图(Delaunay Graph, 它与voronoi diagram对偶)、Relative Neighborhood Graph (RNG)、Gabriel Graph (GG)、Minimum Spanning Trees (MST)。
首先给出结论:Delaunay Graph 是单调的图,而RNG, GG和MST都不是单调的图。
何为图的单调性
在此之前,我们需要先了解一下什么是单调路径?对于图G上的一个m个依次邻接的顶点形成的路径(v1,v2,⋯ ,vm)(v_{1},v_{2},\cdots, v_{m})(v1,v2,⋯,vm),若dist(v1,vm)>dist(v2,vm)>⋯>dist(vm−1,vm)dist(v_1,v_m) > dist (v_2, v_m) > \cdots > dist(v_{m-1},v_m)dist(v1,vm)>dist(v2,vm)>⋯>dist(vm−1,vm),则该路径是一条单调路径,dist(,)dist(,)dist(,)表示两个顶点之间的距离。如果一个图G的任意两个顶点之间均存在单调路径,则图G便是单调图了。
如何证明一个图不是单调的
只需要举一个反例就行了。任意画几个点,分别根据RNG, GG和MST的定义建立相应的图结构,很容易找到不存在单调路径的例子。
证明DG是单调的
下面证明DG是单调的。在此之前先给出一个定理。
定理1. 对于DG中的任意两个顶点vav_ava和vjv_jvj,存在一个德劳内边eake_{ak}eak满足d(vk,vj)<d(va,vj)d(v_k, v_j) < d(v_a, v_j)d(vk,vj)<d(va,vj)。
证明:给定在数据集S上的DG。vav_ava

本文探讨了基于近邻图的近似最近邻搜索算法的效率与精度,重点关注图的单调性对搜索性能的影响。德劳内图(Delaunay Graph)被证明是单调的,而相对邻域图(RNG)、加布里埃尔图(GG)和最小生成树(MST)则不是。单调路径的概念在图理论中至关重要,对于搜索算法的优化有指导意义。尽管RNG在大多数情况下近乎单调,但其非单调性的特殊情况表明,优化搜索路径的策略需要考虑图的特定结构。
最低0.47元/天 解锁文章
192

被折叠的 条评论
为什么被折叠?



