K-近邻算法
定义:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。
计算距离公式:
√(〖(a1-b1)〗^2+〖(a2-b2)〗^2+〖(a3-b3)〗^2 )
需要对数据做标准化处理(特征值)
API:
•
sklearn.neighbors.
KNeighborsClassifier
(
n_neighbors
=5,algorithm='auto')
作业:测试
鸢尾花
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
fr