参考书籍:《机器学习实战》
实验说明:预测约会对象对用户是否具有吸引力
输入数据:每个待约会的对象有三个属性,分别是 每年飞行里程数、玩游戏占时间比、每周吃的冰淇淋(单位公升);(ps:我觉得这三个参数,分别代表一个人是否有钱,生活娱乐,饮食习惯)
样本集:有1000个约会对象的数据,并且每个对象有一个标签,标签有三大类,分别是 不喜欢、魅力一般、非常有魅力
实验过程:
1、将样本集90%当做训练集,10%当做测试集,测试classify.py的错误率
2、用户输入一个约会对象的参数,给出分类的标签,为用户提供建议
代码文件:
file2Matrix.py:样本集存在txt文件中,该函数将样本集输入到内存中,以array的方式存储起来
plotDataSet:将样本集的数据画出来(每个样本只能画出两个变量)
autoNorm.py:将参数归一化,每个参数的大小范围不一致
datingClassTest.py:错误率测试
classify.py:预测分类函数
classifyPerson.py:输入某个人的参数,给出预测结果
knn.py:主函数
样本集及源文件下载:点击打开链接
源文件:
file2Matrix.py:样本集存在txt文件中,该函数将样本集输入到内存中,以array的方式存储起来