一、 KNN算法简介
-
K-近邻算法(K Nearest Neighbor,简称KNN)。
-
KNN算法思想:如果一个样本在特征空间中的 k 个最相似的样本中的大多数属于某一个类别,则该样本也属于这个类别。
-
解决问题:分类问题、回归问题
-
相似性:欧氏距离
-
分类流程
- 计算未知样本到每一个训练样本的距离
- 将训练样本根据距离大小升序排列
- 取出距离最近的 K 个训练样本
- 进行多数表决,统计 K 个样本中哪个类别的样本个数最多
- 将未知的样本归属到出现次数最多的类别
-
回归流程
- 计算未知样本到每一个训练样本的距离
- 将训练样本根据距离大小升序排列
- 取出距离最近的 K 个训练样本
- 把这个 K 个样本的目标值计算其平均值
- 作为将未知的样本预测的值
二、 KNN算法API
2.1 分类问题
- KNN分类API
- sklearn.neighbors.KNeighborsClassifier(n_neighbors=5)
订阅专栏 解锁全文
2129

被折叠的 条评论
为什么被折叠?



