《机器学习实战》第九章“树回归”P164的程序清单9-2出现这个错误,经过多方测试,最终解决。
- 首先在p163的测试中就出了错误,发现返回的mat1只有一行,通过调试发现
def binSplitDataSet(dataSet, feature, value):
mat0 = dataSet[nonzero(dataSet[:,feature] > value)[0],:][0]
mat1 = dataSet[nonzero(dataSet[:,feature] <= value)[0],:][0]
return mat0,mat1
这里是有错的,应该改为:
def binSplitDataSet(dataSet, feature, value):
mat0 = dataSet[nonzero(dataSet[:,feature] > value)[0],:]
mat1 = dataSet[nonzero(dataSet[:,feature] <= value)[0],:]
return mat0,mat1
- 对于问题
TypeError: unhashable type: 'matrix'即matrix类型不能被hash,找到对应的出问题的matrix
在函数chooseBestSplit处
将
for splitVal in set(dataSet[:,featIndex]):
改为:
for splitVal in set((dataSet[:,featIndex].T.A.tolist())[0]):
即可。
本文针对《机器学习实战》第九章“树回归”的程序清单9-2中的错误进行了详细解析,并给出了具体的修正方案。主要解决了两个问题:一是矩阵拆分错误,二是matrix类型无法hash的问题。
859

被折叠的 条评论
为什么被折叠?



