机器学习初涉--k近邻算法

最新推荐文章于 2025-01-05 12:37:05 发布

AmazingJadeWu

最新推荐文章于 2025-01-05 12:37:05 发布

阅读量693

点赞数

CC 4.0 BY-SA版权

分类专栏：算法分类算法文章标签：机器学习算法分类算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/u013668852/article/details/71515052

算法同时被 2 个专栏收录

11 篇文章

订阅专栏

5 篇文章

订阅专栏

本文介绍了K近邻算法的基本原理及其应用场景。该算法通过计算距离来确定待分类样本的类别，特别适合于类域交叉或重叠的情况。文中还讨论了算法的特点、不足及改进措施。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在此对k近邻算法做一个简单的总结：

原理

K-近邻方法通过计算每个训练样例到待分类样品的距离，取和待分类样品距离最近的k个训练样例，k个样品中哪个类别的训练样例占多数，则待分类原组就属于哪个类别。
在实践中往往通过若干次实验来确定K值，取分类误差率最小的K值。

特点

KNN方法主要依靠周围有限的邻近的样本，而不是靠判别类域的方法来确定所属类别，因此对于类域的交叉或者重叠较多的待分类样本集来说，KNN方法更为合适。
不足之处是计算量较大，因为对每一个待分类的样本都要计算它到全体已知样本的距离，才能求得它的K个最邻近点。

改进:
对于计算量大的问题目前常用的解决办法是事先对已知样本点进行剪辑，实现去除对分类作用不大的样本。
对样本进行组织与整理，分群分层，尽可能地将计算压缩在接近测试样本领域的小范围内。

总的来说，算法的适应性较强，尤其适用于样本容量较大的自动分类问题，而那些样本容量较小的分类问题采用这种算法比较容易产生误分。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。