【AI Guide】AI面试攻略只用看这一篇就够了!力争做全网最全的AI面试攻略——机器学习(十一)降维学习
降维学习
在机器学习中,k近邻学习(knn)是一种非常基础的有监督学习算法:首先,确定训练样本,以及某种距离度量,然后对于某个给定的测试样本,找到训练集中距离最近的k个样本,对于分类问题使用投票法获得预测结果,对于回归问题使用平均法获得预测结果。我们还可基于距离远近进行加权平均或加权投票,距离越近的样本权重越大。
Knn属于懒惰学习。懒惰学习是指在训练阶段仅仅是把样本保存起来,训练时间开销为零,待收到测试样本后再进行处理。与之相对的,急切学习在训练阶段就对样本进行学习处理的方法。
Knn虽然简单,但是它的泛化错误率不超过贝叶斯最优分类器错误率的两部。
但是,上述讨论基于一个重要的假设,即任意测试样本 x x