要点
KNN(最近邻)是原始且懒惰的机器学习形式:仅仅将所有训练数据存储下来。
当有新的待估计点输入时,搜寻得到存储数据中阈值最接近的K个数据点。用它们的多数的类别或者均值作为输出。简单的训练方式导致了搜寻大量数据时的漫长的响应等待。
KNN在很多实际应用中是有效的。因为输入简单通常输出也简单,这是机器学习的一个基本假设。它很像人类推理的案例学习过程。尽管简单粗暴,但它在很多情况下确实成效非凡。
-->KNN之所以实现是因为基于 Natura non facit saltus(拉丁语“自然不会跳变”)这一规律。自然万物和属性总是渐变的,而不是突变。
-->WKNN 加权KNN
注意:译文不求规范,不求顺序,只挑感兴趣的译,作为笔记之用,错误难免