KNN的特点决定了当数据维度较高时,搜索k个最近邻,就需要k次全局计算,计算量太大。故而才有了KD树这样的思想,让空间划分为若干个子空间,形成树状的结构,搜索最近邻时,从叶子向上回溯。这样就把一个全局空间计算的问题,变成了局部空间计算的问题。
本文探讨了KNN算法在高维数据上的局限性及计算挑战,并介绍了KD树这一优化方案。通过将空间划分成多个子区域并构建树状结构,KD树能够显著减少搜索最近邻所需的计算量。
KNN的特点决定了当数据维度较高时,搜索k个最近邻,就需要k次全局计算,计算量太大。故而才有了KD树这样的思想,让空间划分为若干个子空间,形成树状的结构,搜索最近邻时,从叶子向上回溯。这样就把一个全局空间计算的问题,变成了局部空间计算的问题。
2235

被折叠的 条评论
为什么被折叠?