轴对齐子空间中的高效相似性搜索及多特征部分细化方法
1. 轴对齐子空间中的相似性搜索算法
在轴对齐子空间的相似性搜索中,研究人员提出了多种算法,并进行了大量实验对比。
1.1 单排序与多排序策略对比
实验比较了单排序(SR)和多排序(MR)策略的性能。结果表明,在所有测试数据集上,多排序策略均优于单排序策略。由于篇幅限制,后续与其他竞争方法的实验对比仅展示多排序策略的结果。
1.2 与其他方法的对比实验
研究人员进行了两组实验,分别改变子空间维度数 $|F’|$ 和目标邻域大小 $k$。
- 改变子空间维度数 $|F’|$ :固定 $k = 10$,将 $|F’|$ 从 2 变化到 32。实验结果显示,对于所有数据集和 $|F’|$ 的所有取值,所提出的方法通常优于其竞争对手。其中,PVA 方法成本最高,可能是因为它使用了顺序扫描。PT 方法利用在全维空间上构建的 R 树来回答子空间查询,当子空间维度 $d_{F’}$ 与全空间维度 $d_{F}$ 差异较大时,效果不佳,但随着子空间维度数增加,性能有所改善。不过,由于 R 树在中等维度空间中的性能限制,当子空间维度数增加时,PT 方法的成本会变得过高。DMI 方法通过聚合每个查询维度邻域的部分结果来处理查询,随着子空间维度数的增加,聚合成本会变得过高。而所提出的算法通过将处理限制在单个查询维度,避免了昂贵的聚合操作。与 SK_MR 相比,在高子空间维度下,MAET + MR 可以在运行时间上实现显著改进,同时仍保持较高的准确性。随着 $|F’|$ 的增加,所有测试方法的计算成本最终都会趋向于顺序搜索的成本,这是由于维度诅咒的影响。 <
超级会员免费看
订阅专栏 解锁全文
14

被折叠的 条评论
为什么被折叠?



