国科大学习资料–数据挖掘(刘莹)–第三章习题及参考答案
国科大学习资料–数据挖掘(刘莹)–第三章习题及参考答案
国科大学习资料–数据挖掘(刘莹)–第三章习题及参考答案
第 3 章分类与回归
3.1简述决策树分类的主要步骤。
答:决策树生成的过程如下:
(1)对数据源进行数据预处理, 得到训练集和测试集;
(2)对训练集进行训练;
(3)对初始决策树进行树剪枝;
(4)由所得到的决策树提取分类规则;
(5)使用测试数据集进行预测,评估决策树模型;
3.2给定决策树,选项有:(1)将决策树转换成规则,然后对结果规则剪枝,或(2)对决策树剪枝,然后将剪枝后的树转换成规则。相对于(2),(1)的优点是什么?
答:相对于(2),(1)的优点是:由于第一种方法已经将决策树转换成规则,通过规则,可以很快速的评估决策树以及其子树紧凑程度,不能提高规则的估计准确率的任何条件都可以减掉,从而泛化规则;