在我看来,决策树的作用只有一个,就是做分类。并且我觉得机器学习的功能就是聚类和分类。如果以后另有发现,我改。 参考 1.树的概念 2.过度拟合 所谓过度拟合,就是实验中通过这种决策树做分类效果很好,但是到实际生产中正确率就下降很多 3.纯度,就是说有一个属性可以直接把测试数据集分为两类,假如这两类在是p1和p2,如果p2和p1的差值越大,说明通过这个属性作为起始节点就越合理。 4.正太分布和置信区间?