【机器学习】KNN算法

LocalMinima

已于 2022-06-02 22:04:57 修改

阅读量2k

点赞数

分类专栏：机器学习与视觉大杂烩文章标签：机器学习算法分类

于 2022-06-02 21:51:46 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/chanlv7717/article/details/125105910

版权

机器学习与视觉大杂烩专栏收录该内容

11 篇文章 ¥79.90 ¥99.00

订阅专栏

本文深入探讨了KNN算法的基本思想和流程，包括K值选取的影响、如何处理样本不平衡问题以及解决计算量大的策略。此外，介绍了KD树在优化KNN算法中的应用，并提供了Python实现的相关内容。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

文章目录

一、KNN 的基本思想
二、KNN算法流程
三、KNN优化
四、KD树
五、Python 实现

一、KNN 的基本思想

找到未分类的测试样本附近已知类别的的样本，该样本的类别由K个已知类别样本的投票选出，也就是距离最近的K个样本的类别。

二、KNN算法流程

1）计算待分类点与已知类别的点之间的距离
2）按照距离递增次序排序
3）选取与待分类点距离最小的K个点
4）确定前K个点所在类别的出现次数
5）返回前K个点出现次数最高的类别作为待分类点的预测分类

三、KNN优化

3.1 K值的选取

作为KNN算法中唯一的一位超参数，K值的选择对最终算法的预测结果会产生直观重要的影响。
如果选择较小的K值，就相当于用较小的邻域中的训练实例进行预测，“学习”的近似误差会减小，只有输入实例较近的训练实例才会对预测结果起作用。但缺点是“学习”的估计误差会增大，预测结果会对近邻实例点非常敏感。如果邻近的实例点恰巧是噪声，预测就会出错。换句话说，K值得减小就意味着整体模型非常复杂，容易发生过拟合。
如果选择较大的K值，就相当于用较大邻域中的训练实例进行预测，其实优点是减少学习的估计误差，

了解本专栏

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

LocalMinima 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。