K-近邻算法概述
采用不同特征值之间的距离方法进行分类.
工作原理:
存在一个样本数据集合,并且样本集中每个数据都存在标签,即我们知道样本集中每一数据与所属分类 的对应关系.输入没有标签的数据,提取样本集中特征最相似的数据…一般来说,我们只选择样本数据集中 前k个最相似的数据,这就是K-近邻算法K的出处.
示例:使用K-近邻算法改进约会网站的配对效果
- 准备数据:从文本文件中解析数据
- 分析数据:使用Matplotlib创建散点图
- 归一化特征值
- 测试算法
- 使用算法
示例:手写数字识别系统
- 准备数据:将图像转换为测试向量
- 测试算法:使用K-近邻算法识别手写数字