LSH的总体思想包括过滤和查询两个过程。假定哈希函数族,每个哈希函数的作用是将高维的二进制空间映射到低维的二进制空间中。随机从H中选择一个哈希函数,对P中的每个点使用同一的函数进行映射,即,将点映射至磁盘桶内。
例:设S是有序的,多重集s索引从。是将p映射到s维子空间。设d=5,p=01100,s=3,S={2,2,4},则p|S=110。从H中随机选择哈希函数,重复以下过程i=1,…,t。
从中随机挑选S的子集,随机选择哈希函数 , ,
例如: 假设集合中有4个3维的点,其坐标为,,,;查询点。
根据LSH在Hamming空间的过滤分类过程,有。
1、将P中的点映射至Hamming空间内,则
;;;;
2、有集合,从集合I中选择l个子集,令l=5,k=3,即从集合I中随机选择k个元素作为I的一个子集,共选择5个,有,,.
3、计算p|I,得
(1)
(2)
(3)
(4)
(5)
4、令bucket ,则
g1 g2 g3 &