k-近邻算法(KNN)--2改进约会网站的配对效果---by香蕉麦乐迪

参考书籍:《机器学习实战》

实验说明:预测约会对象对用户是否具有吸引力

输入数据:每个待约会的对象有三个属性,分别是 每年飞行里程数、玩游戏占时间比、每周吃的冰淇淋(单位公升);(ps:我觉得这三个参数,分别代表一个人是否有钱,生活娱乐,饮食习惯)

样本集:有1000个约会对象的数据,并且每个对象有一个标签,标签有三大类,分别是  不喜欢、魅力一般、非常有魅力

实验过程:

1、将样本集90%当做训练集,10%当做测试集,测试classify.py的错误率

2、用户输入一个约会对象的参数,给出分类的标签,为用户提供建议


代码文件:

file2Matrix.py:样本集存在txt文件中,该函数将样本集输入到内存中,以array的方式存储起来

plotDataSet:将样本集的数据画出来(每个样本只能画出两个变量)

autoNorm.py:将参数归一化,每个参数的大小范围不一致

datingClassTest.py:错误率测试

classify.py:预测分类函数

classifyPerson.py:输入某个人的参数,给出预测结果

knn.py:主函数


样本集及源文件下载:点击打开链接


源文件:

file2Matrix.py:样本集存在txt文件中,该函数将样本集输入到内存中,以array的方式存储起来

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值