引言
上一小节中,我们初步介绍了Multi-Probe LSH算法的大致思路,为了不显得博客文章太冗杂,所以将这个话题分成几篇文章来写。
在该小节文章中,我将具体介绍一下生成微扰向量序列(a sequence of perturbation vectors)的方法及相关分析。
步进式探测(Step-Wise Probing)
n-step微扰向量Δ有n个非零坐标,根据位置敏感哈希的性质,距离查询q一步远(one step away)的哈希桶要比距离q两步远(two step away)所包含的数据点更加接近q。
这种想法激发了步进式探测方法,首先探测所有相差一步的哈希桶(1-step buckets),然后再探测所有两步的哈希桶(2-step buckets),以此类推。
对于LSH索引由L个哈希表和每个哈希表中M个哈希函数而言,
n-step buckets的总数是![]()
所有s-step buckets之内的桶的总数是
![]()