KNN中的kd树笔记

最新推荐文章于 2024-02-19 11:22:31 发布

原创最新推荐文章于 2024-02-19 11:22:31 发布 · 279 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

机器学习专栏收录该内容

18 篇文章

订阅专栏

首先，讲一下kd树的概念，实现k近邻法时，主要考虑的问题是如何对训练数据进行快速k近邻搜索。这在特征空间的维数大及训练数据容量大时尤其必要。k近邻法最简单的实现是线性扫描（穷举搜索），即要计算输入实例与每一个训练实例的距离。计算并存储好以后，再查找K近邻。当训练集很大时，计算非常耗时。为了提高kNN搜索的效率，可以考虑使用特殊的结构存储训练数据，以减小计算距离的次数。

看来统计学习中的kd树的讲解，感觉讲的有点啰嗦，我个人对kd树的理解是这样的。

首先，你对你的数据集中的第一个属性进行一次划分，可以根据他的中位数进行一个划分，然后第一个属性划分完之后你可以再根据第二个属性进行划分，同样的你可以根据他的中位数进行划分，然后继续对剩下的属性进行一个划分，划分完之后就形成了一个如下图的kd树。假设数据集是

T={(2,3),(5,4),(9,6),(4,7),(8,1),(7,2)}T={(2,3),(5,4),(9,6),(4,7),(8,1),(7,2)}，构造一个平衡kd树：

但是，就算形成了一个平衡树，也可能这颗树的搜索效率不是一个最好的。

博客等级

码龄10年

102
原创

139
点赞

611
收藏

287
粉丝

关注

私信

热门文章

分类专栏

flink 9篇
大数据进阶之路 33篇
java基础 48篇
Sql 1篇
Calcite 1篇
LeetCode 10篇
网络 12篇
rabbitmq 3篇
redis 3篇
机器学习 18篇
java框架 3篇
传感器可靠性研究 9篇
大数据 53篇
算法 4篇
Linux入门 11篇

展开全部收起

上一篇：: 梯度概念

下一篇：: 朴素贝叶斯

最新评论

Java 中为什么static方法中不能使用this关键字
好想改ID: 补充一点一楼的，这两天准备秋招学了JVM内存模型之后，发现其实跟类加载机制还有Java内存区域有关，类：加载->连接->初始化->使用->卸载，静态变量、静态方法、静态代码块其实都在加载、连接和初始化阶段完成创建、赋值等工作，类的实例化则在使用阶段。而在一个线程执行构造/实例化方法（实例化对象才会涉及的方法）的时候，线程私有内存区域->虚拟机栈->局部变量表中index=0的槽位会存储this，而静态方法（或者说类方法，在实例化之前已经构建完成）则不会存在局部变量的slot中，所以静态方法没法通过this访问类中其他变量或者方法，也就是static方法中没办法使用this关键字。（ps：因为还在学习，如果有误欢迎指正。）

大家在看

最新文章

目录

展开全部

收起

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

yann.bai 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。