算法思想:计算目标与样本库中所有样本的距离,根据计算出来的距离将所有样本由近到远进行排序,取出前k个样本,将这k个样本中出现次数最多的类型作为目标的类别。
from numpy import *
import operator
def createDataSet():
group = array([[1.0, 1.1], [1.0, 1.0], [0, 0], [0, 0.1]])
labels = ['A', 'A', 'B', 'B'
算法思想:计算目标与样本库中所有样本的距离,根据计算出来的距离将所有样本由近到远进行排序,取出前k个样本,将这k个样本中出现次数最多的类型作为目标的类别。
from numpy import *
import operator
def createDataSet():
group = array([[1.0, 1.1], [1.0, 1.0], [0, 0], [0, 0.1]])
labels = ['A', 'A', 'B', 'B'