scikit-learn K-近邻算法（KNN）

最新推荐文章于 2025-03-14 23:48:48 发布

七十二时雲

最新推荐文章于 2025-03-14 23:48:48 发布

阅读量6.1k

点赞数 6

分类专栏：机器学习 python 算法文章标签：算法机器学习 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_37212752/article/details/83094052

版权

本文介绍了K-近邻(KNN)算法的工作原理、优缺点及适用数据范围。KNN通过计算样本间的欧几里得距离进行分类或回归，常用于机器学习中的分类问题。在Python中，可以利用scikit-learn库实现KNN，包括KNeighborsClassifier和KNeighborsRegressor。文章通过实例展示了KNN在分类和回归问题上的应用，同时讨论了欠拟合和过拟合的概念。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

k-近邻算法原理：采用测量不同特征值之间的距离方法进行分类。

优点：精度高、对异常值不敏感、无数据输入假定。
缺点：时间复杂度高、空间复杂度高。
适用数据范围：数值型和标称型。

工作原理：存在一个样本数据集合，也称作训练样本集，并且样本集中每个数据都存在标签，即我们知道样本集中每一数据与所属分类的对应关系。输人没有标签的新数据后，将新数据的每个特征与样本集中数据对应的特征进行比较，然后算法提取样本集中特征最相似数据（最近邻）的分类标签。一般来说，我们只选择样本数据集中前K个最相似的数据，这就是K-近邻算法中K的出处,通常K是不大于20的整数。最后，选择K个最相似数据中出现次数最多的分类，作为新数据的分类。

思想：分类回归

数学依据：欧几里得距离

依赖包：

分类问题：from sklearn.neighbors import KNeighborsClassifier
回归问题：from sklearn.neighbors import KNeighborsRegressor

常用方法：

knn.fit(X, y) 将模型使用X作为培训数据和y作为目标值
knn.predict(X) 为所提供的数据预测类标签
datasets.load_iris(return_X_y=False) 载入并返回数据集（分类）
- 'data'：学习的数据
- 'target'：分类的标签

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。