k近邻学习

最新推荐文章于 2024-08-03 17:48:57 发布

原创最新推荐文章于 2024-08-03 17:48:57 发布 · 533 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#算法

1.概念

k邻近学习是第一种常用的监督学习方法，其工作机制如下：给定测试样本，基于某种距离度量找出训练集中与最靠近的k个训练样本，然后基于这k个“邻居”的信息来进行预测。

一个简单的例子：如果有人想根据相似性推荐一些东西，他们会为用户推荐一首与其喜欢的歌曲醉相思的，但是他还未曾听过的歌。这种做法其实是1邻近算法。

完整的kNN算法是这种直觉做法的一种扩展，在做出推荐之前，可能会同时参考多于一个的数据点。完整的k近邻算法原理和我们向朋友征求意见的原理差不多：首先，我们找到一些和我们品味相似的朋友，然后向他们征求意见。如果他们中大多数推荐了同样的物品，我们则推测这款物品也应该是我们本身喜欢的东西。kNN算法就是把这种思路转换成了一种可行的算法。

kNN通过依据k个对象中占优的类别进行决策，而不是单一的对象类别决策。这两点就是kNN算法的优势。

kNN算法的思想：就是在训练集中数据和标签已知的情况下输入测试数据，将测试数据的特征让你给与训练集中对应的特征进行相互比较，找到训练集中最为相似的前k个数据，则该测试数据对应的类别就是k个数据中次数最多的那个分类。