1. 距离的定义: 欧氏距离
a. 属性值的标准化
b. 在实践中,属性之间距离的真正含义是什么?
2. 如何寻找最近邻居?
a. kd-tree 既要求树有完美的平衡结构,又要求区域近似方形. 直角问题.
b. ball tree
3. k-最近邻法
4. 最近邻规则在实践中的问题
a. 对于较大规模的训练数据集,速度往往很慢
b. 碰到干扰数据,性能表现较差
c. 当不同的属性对分类结果存在不同程度的影响时,即极端的情形是当某个属性对分类来说完全无关时,性能表现较差。
d. 不能实现明确的推广。