需求背景:
XX一直使用约会网站寻找适合自己的约会对象,ta会把人分为3种类型:
不喜欢、魅力一般、非常有魅力
对人分类轴,发现了对象样本的以下3种特征:
1、每年获得的飞行里程数
2、玩视频游戏所耗时间百分比
3、每周消费的冰淇淋数量
数据初始化:
将上述特征输入到分类器之前,必须将待处理数据的格式处理成分类器可以接受的格式。因为源数据存在txt文件中,所以要创建一个函数处理数据:
def file2matrix(filename):
fr=open(filename)
arrayOlines=fr.readlines()
numberOfLines=len(arrayOlines)
returnMat=zeros((numberOfLines,3))
classLabelVector=[]
index=0
for line in arrayOlines:
line=line.strip()
listFromLine=line.split('\t')
returnMat[index,:]=listFromLine[0:3]
classLabelVector.append(int(listFromLine[-1]))
index += 1
return returnMat,classLabelVector
从