机器学习（八）——KNN

最新推荐文章于 2025-03-24 22:25:09 发布

一大块肉松

最新推荐文章于 2025-03-24 22:25:09 发布

阅读量1.4k

点赞数

分类专栏：机器学习文章标签：机器学习深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_51547017/article/details/124552725

版权

机器学习专栏收录该内容

11 篇文章

订阅专栏

一、KNN定义

$k$ 近邻（ $k - N e a r e s t N e i g h b o r ，简称 k N N$ ）学习是一种有监督学习方法。

$k$ 近邻：可以用于分类任务中，也可以用于回归中。

$\qquad$ 在分类任务常采用“投票法”，即选择k个样本中出现最多的类别作为测试样本所属的类别；
$\qquad$ 在回归任务中采用“平均法”，即将 $k$ 个样本的实际输出的平均值作为测试样本的输出结果。

二、KNN工作机制

$\qquad$ 工作机制：给定测试样本数据集，基于某种距离度量找训练集中与其最靠近的 $k$ 个训练样本，然后基于这 $k$ 个邻居的信息来进行预测。
$\qquad$ 图示：
在这里插入图片描述

当 $k = 1$ 时，属于类别1
当 $k = 3$ 时，属于类别2
当 $k = 5$ 时，属于类别1

$\qquad$ 从结果中可以看出， $k$ 是一个重要的参数， $k$ 的取值不同，会导致不同的分类结果。

$\qquad$ 具体流程如下：

计算已知类别的数据集中的点与测试样本点之间的距离；
将计算的结果进行升序排列；
按照选取的 $k$ ，取出排序列表中前 $k$ 个样本点；
统计前 $k$ 个样本点所属的类别，统计类别出现的频率；
将出现频率最高的类别作为当前测试样本点的预测结果。

三、距离度量

闵可夫斯基距离（Minkowski distance）
欧式距离（Euclidean distance）
曼哈顿距离（Manhattan distance）

1.闵可夫斯基距离

在这里插入图片描述

2.欧式距离

当 $p = 2$ 时，闵可夫斯基距离即是欧式距离

3.曼哈顿距离

当 $p = 1$ 时，闵可夫斯基距离即是曼哈顿距离

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。