1、决策树(ID3)西瓜集算例 决策树(ID3)中选择哪一个特征进行分裂,称之为特征选择。 特征选择是找出某一个特征使得分裂后两边的样本都有最好的“归宿”,即左边分支的样本属于一个类别、右边分支的样本属于另外一个类别,左边和右边分支包含的样本尽可能分属同一类别,此时分裂节点的纯度(purity)高,能够表征这种纯度高低的常用指标是信息熵(information entropy)。 假设有一个数据集 D D D,包含