最近在学习《机器学习实战》这本书,在做到里面第08章的时候发生了一些小错误,具体内容如下:
数据总共有4177行,9列,最后一列为鲍鱼的年龄,为标签值,前8列为数据特征,数据集中的数据长这个样子:
在读取数据的时候,定义了loaddata()函数,最初时候定义的函数如下:
#示例:鲍鱼年龄预测—数据读取
def loaddata_abalone(filename):
f = open(filename)
num = len(f.readline().strip().split()) - 1 #数据特征的数目
data = []
label = []
for i in f.readlines():
line = i.strip().split() #将字符串分割返还的是列表
temp = []
for j in range(num):
temp.append(float(line[j]))
data.append(temp)
label.append([float(line[-1])])
return data,label
data,label= loaddata_abalone(r'E:\MLiA_SourceCode\machinelearninginaction\Ch08\abalone.txt')
data = np.mat(data)
print