【机器学习】K-近邻算法详解(含算法样例代码实现)

云日松

已于 2023-04-22 15:51:36 修改

阅读量2.3k

点赞数 1

分类专栏：机器学习文章标签：算法 python 机器学习

于 2023-02-23 22:34:45 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_52185996/article/details/129191389

版权

本文介绍了K-近邻算法的基本原理，包括算法的概念、优缺点以及一般流程。通过一个约会网站配对的例子，展示了如何使用该算法处理数据，包括数据准备、分析、归一化和模型测试。文章还提供了算法实现的代码示例，强调了特征归一化在处理不同尺度特征时的重要性，并给出了一个简单的命令行应用示例，让用户输入特征来预测匹配类型。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一、引言

$\text{[math]}$ 近邻 $\text{[math]}$ 算法,也叫 $\text{[math]}$ 最近邻算法，1968年由 $\text{[math]}$ 和 $\text{[math]}$ 提出，是机器学习算法中比较成熟的算法之一。 $\text{[math]}$ 近邻算法使用的模型实际上对应于对特征空间的划分。 $\text{[math]}$ 算法不仅可以用于分类，还可以用于回归。

二、K-近邻算法内容

1、概念

$\text{[math]}$ 近邻算法就是，先给定一个训练数据集，这个数据集中可能是某类物品的特征及分类，然后给出某个物品的特征，根据训练数据集中的各个物品的特征与这个需要判别分类的物品的“距离”远近，找出距离最近的 $\text{[math]}$ 个，然后这 $\text{[math]}$ 个物品中最多物品所归属的那个分类就是这个需要判别的物品所归属分类判断的结果。

2、优缺点

优点：精度高、对异常值不敏感、无数据输入假定。

缺点：计算复杂度高、空间复杂度高。

3、算法的一般流程

(1) 收集数据

可以使用任何方法(爬虫、网络上公开的数据集等)

(2) 准备数据

距离计算所需要的数值，最好是结构化的数据格式(一般是用些 $\text{[math]}$ 矩阵或者数组这种来方便储存结构化后的数据)

(3) 分析数据

可以用任何方法(一般常用

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

云日松 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。