K 最近邻 (k-Nearest Neighbor,KNN) 分类算法
利用训练数据集对特征向量空间进行划分
三要素: k值的选择、距离度量、分类决策规则
k近邻算法
(1)给定距离度量,在训练集T中找到与x最近邻的k个点
涵盖这k个点的x领域记作Nk(x);
(2)在Nk(x)中根据分类决策规则(如多数表决)决定x的类别y:
y=argmax∑I(yi=cj), i=1,2...N;j=1,2...K
I为指示函数,yi=cj 时 I =1,否则 I =0.
K=1时称为最近邻算法
k近邻没有显式的学习过程
k近邻模型
1:距离度量