更新时间:2017.11.18
简化语言,更加通俗
Ⅲ.实现
实现部分采用的数据集是机器学习实战中的数据集.代码则是按照自己的理解重新改写了一遍.
读取数据模块:data.py
import numpy as np
def loadData(filename):
dataSet=np.loadtxt(fname=filename,dtype=np.float32)
return dataSet
用numpy内置的读取txt文件的函数就行,方便快捷.这里就不多讲了.
CART核心模块:CART.py
import numpy as np
import matplotlib.pyplot as plt
#split dataSet trough featureIndex and value
def splitDataSet(dataset,featureIndex,value):
subDataSet0=dataset[dataset[:,featureIndex]<=value,:]
subDataSet1=dataset[dataset[:,featureIndex]>value,:]
return subDataSet0,subDataSet1