KNN算法--物以类聚，人以群分

最新推荐文章于 2021-12-05 16:09:17 发布

转载最新推荐文章于 2021-12-05 16:09:17 发布 · 512 阅读

·

0

·

CC 4.0 BY-SA版权

原文链接：http://www.cnblogs.com/zhoudayang/p/5058271.html

文章标签：

KNN（K近邻）算法是机器学习中理论简单且易理解的方法。它通过计算新数据与训练数据之间的距离，选取最近的K个邻居进行分类或回归。KNN属于监督学习，用于分类时每个训练数据都有明确的label，用于回归时则根据邻居的值预测出明确的值。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

KNN（K Nearest Neighbors,K近邻）算法是机器学习所有算法中理论最简单，最好理解的。KNN是一种基于实例的学习，通过计算新数据与训练数据特征值之间的距离，然后选取K（K>=1）个距离最近的邻居进行分类判断（投票法）或者回归。如果K=1，那么新数据被简单分配给其近邻的类。KNN算法算是监督学习还是无监督学习呢？首先来看一下监督学习和无监督学习的定义。对于监督学习，数据都有明确的label（分类针对离散分布，回归针对连续分布），根据机器学习产生的模型可以将新数据分到一个明确的类或得到一个预测值。对于非监督学习，数据没有label，机器学习出的模型是从数据中提取出来的pattern（提取决定性特征或者聚类等）。例如聚类是机器根据学习得到的模型来判断新数据“更像”哪些原数据集合。KNN算法用于分类时，每个训练数据都有明确的label，也可以明确的判断出新数据的label，KNN用于回归时也会根据邻居的值预测出一个明确的值，因此KNN属于监督学习。
KNN算法的计算过程:

选择一种距离计算方式, 通过数据所有的特征计算新数据与已知类别数据集中的数据点的距离

按照距离递增次序进行排序，选取与当前距离最小的k个点

对于离散分类，返回k个点出现频率最多的类别作预测分类；对于回归则返回k个点的加权值作为预测值

来自为知笔记(Wiz)

转载于:https://www.cnblogs.com/zhoudayang/p/5058271.html

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。