动态高维数据的高效 kNN 连接
在处理高维数据时,kNN(k-Nearest Neighbors)连接是一个重要的问题。传统的 kNN 连接技术在处理动态高维数据时存在一些局限性,例如在更新数据时需要重新计算所有用户的 kNN,这会导致计算成本很高。为了解决这些问题,人们提出了一些优化方法。
1. 现有 kNN 连接技术
- VA-File、iMinMax、LSH、LSHI :这些技术通常可以提高高维数据集的 kNN 性能。
- MuX、Gorder、iJoin :这些 kNN 连接技术采用嵌套循环搜索策略处理高维数据集。MuX 和 iJoin 使用索引嵌套循环连接技术,而 Gorder 是块嵌套循环连接方法。不过,它们是在静态数据集上操作,更新时需要对所有用户进行 kNN 计算,成本高昂。
- kNN Join+ 技术 :使用了 RkNN 连接表、kNN 连接表、iDistance 和 Sphere 树四种数据结构。iDistance 用于查找新插入点的 kNN,Sphere 树用于查找 RkNN。该技术还开发了共享查询优化策略,但基于磁盘的方法难以满足实时要求。
- HDR-tree 和 HDR*-tree :用于连续 kNN 连接。HDR Tree 利用 PCA 和聚类方法进行降维,HDR -Tree 采用随机投影方法。实验结果表明,HDR Tree 速度更快但准确性较低。
超级会员免费看
订阅专栏 解锁全文
1030

被折叠的 条评论
为什么被折叠?



