以后文章就不再强调三要素(模型、策略、算法),而是直接上最新鲜的部分。
1)k的选择
2)距离的度量
3)k临近法的实现:kd树
3.1)kd树的构造
3.2)kd树的搜索
1)k的选择
一般初始化为比较小的值,用交叉验证判断哪一个值更好。
2)距离的度量
我们更常用的是欧氏距离,即p=2。
3)k临近法的实现:kd树
k临近法的实现主要考虑如何快速地进行k临近搜索。最简单的注意扫描计算距离并找到最小的k个距离点太耗时,此处给出kd树方法。
k-d树(k-dimensional树的简称),是一种对k维空间(注意,k不是k个邻居的意思)中的实例点进行存储以便对其进行快速搜索的二叉树结构。
假设有6个二维数据点{(2,3),(5,4),(9,6),(4,7),(8,1),(7,2)},数据点位于二维空间内,如图2:

本文介绍了k临近法中的k选择、距离度量以及如何使用kd树进行快速搜索。在k选择上,通常通过交叉验证选取最佳值;距离度量以欧氏距离为主。kd树是一种用于k维空间快速搜索的二叉树结构,通过构造和搜索过程来高效查找最近邻点。文章以二维数据点为例,详细阐述了kd树的构造和搜索过程。
最低0.47元/天 解锁文章
1479

被折叠的 条评论
为什么被折叠?



