knn算法介绍 knn算法是机器学习中最简单的算法。其原理类似于古语“近朱者赤近墨者黑”,即同类物体的差异性小,异类差异性大,而这种差异往往是用“距离”表示。“距离”的度量一般采用欧氏距离。 算法思路 1.计算待分类的样本和样本空间中已标记的样本的欧氏距离。(如图中绿点为待分类样本,要计算绿点与图中所有点的距离) 2.取距离最短的k个点,k个点进行投票,票数最多的类为待测样本的类。(若k为3,则图中实线圆中的点是距离绿点最短的点,其中三角形有两个,正方形1个,所以绿点为三角形;若k为5,则图中虚线中的点为最近邻点,其中正方形有3个,三角形2个,所以绿点为正方形。由此可知,k的取值会影响分类的结果) 算法的优缺点 1.优点 算法简单有效 2.缺点