输入:只含有映射编码的ArrayList
输出:只含有特征值的ArrayList(明显变小)
定义一个窗口长度w,把散列值序列分配在若干个内容互相重叠窗口中,每相邻的两个窗口中有w-1 个散列值是完全重叠的。在确保不和前一个提取出的特征发生冲突的情况下,在当前窗口中选择最小的散列值作为文本特征。
本文介绍了一种将只含有映射编码的ArrayList转换为只含有特征值的ArrayList的方法,通过定义窗口长度w,将散列值序列分配到重叠窗口中,选择每个窗口内的最小散列值作为文本特征。
输入:只含有映射编码的ArrayList
输出:只含有特征值的ArrayList(明显变小)
定义一个窗口长度w,把散列值序列分配在若干个内容互相重叠窗口中,每相邻的两个窗口中有w-1 个散列值是完全重叠的。在确保不和前一个提取出的特征发生冲突的情况下,在当前窗口中选择最小的散列值作为文本特征。
1370

被折叠的 条评论
为什么被折叠?