本文主要来自李航老师的《统计学习方法》。
算法
k近邻是一种常用的分类与回归算法,其原理比较简单:
- 输入:训练集 T={ (x1,y1),(x2,y2),…,(xn,yn)} ; 待分类样本 x′ ;设定好的最近邻个数 k
- 输出:
x′ 的类别标签 算法:
- 搜索训练集训练集 T ,根据给定的距离度量(如欧式距离),找出与 x′ 距离最近的 k 个点,并把涵盖这些点的领域记为
Nk(x
- 搜索训练集训练集 T ,根据给定的距离度量(如欧式距离),找出与 x′ 距离最近的 k 个点,并把涵盖这些点的领域记为

本文介绍了K近邻(KNN)算法的基本原理、度量方式、k值选择的影响,以及如何利用kd树提高搜索效率。通过讨论偏差与方差的平衡,解释了k值选择的重要性,并给出了Python实现kd树和KNN搜索的思路。
最低0.47元/天 解锁文章
2539

被折叠的 条评论
为什么被折叠?



