K-近邻算法
简单来说,如下图所示
这个绿色的球是什么颜色,就是说,离他最近的3个点(那就是k-3)是什么颜色。
2/3是红色。
如果是k-5呢?
那就是蓝色。
这就是knn算法。
一种很好理解的分类概率模型。
在KNN中,通过计算对象间距离来作为各个对象之间的非相似性指标,避免了对象之间的匹配问题,在这里距离一般使用欧氏距离或曼哈顿距离:
欧氏距离
差的平方求和开根
某个点到另一个点的直线距离,它认为两点之间,始终是可以通过直线距离到达的(更适用于欧式空间)
曼哈顿距离
差的绝对值求和开根
曼哈顿距离也称为城市街区距离。在曼哈顿距离的世界里,规则是我们只能沿着线划出的格子行进。
曼哈顿距离仍然只有之前欧氏距离的局限。在距离计算中,认为各个维度对于距离d的贡献权重是一样的。
参考
https://www.cnblogs.com/ybjourney/p/4702562.html