输入:只含有数字编码的ArrayList
输出:只含有映射编码的ArrayList
采用K-gram方法进行分块,相邻两个块有k-1个重复元素。然后将每k个元素进行hash映射。存入ArrayList(输入的那个就行)
哈希函数:
对于串:P = p1p2p3...pm


其中 s 是字符集合大小 这里s=2500
m根据java的long类型的大小,最大为5(还要乘P1,所以不是6)
本文介绍了一种基于K-gram方法对只含有数字编码的ArrayList进行分块,并通过哈希函数映射到新ArrayList的过程。详细解释了分块逻辑、哈希函数原理及应用。
输入:只含有数字编码的ArrayList
输出:只含有映射编码的ArrayList
采用K-gram方法进行分块,相邻两个块有k-1个重复元素。然后将每k个元素进行hash映射。存入ArrayList(输入的那个就行)
哈希函数:
对于串:P = p1p2p3...pm


其中 s 是字符集合大小 这里s=2500
m根据java的long类型的大小,最大为5(还要乘P1,所以不是6)
870

被折叠的 条评论
为什么被折叠?