需要一个文件包,是海伦调查的1000分数据,共四列,前三列为数据,最后一列为分类是否有魅力。
from numpy import * # 导入科学计算包
from matplotlib.font_manager import FontProperties
import matplotlib.lines as mlines
import matplotlib.pyplot as plt # 导入绘图工具包
import operator # 导入运算符模块
def file2matrix(filename):
fr = open(filename) # 打开文件
arrarOLines = fr.readlines() # 读取内容
numberOfLines = len(arrarOLines) # 解析有多少行
returnMat = zeros((numberOfLines, 3)) # 创建行数*3的矩阵,以0填充
classLabelVector = []
index = 0
for line in arrarOLines:
line = line.strip() # 删除空白字符
listFromLine = line.split('\t') # 以空格来分割
returnMat[index, :] = listFromLine[0:3] # 前三位放入矩阵
classLabelVector.append(listFromLine[-1]) # 最后一位存入标签
index += 1
return returnMat, classLabelVector
def showData(datingDataMat, datingLabels):
font = FontProperties('SimHei') #设置字体为黑体
fig, ax = p