
分类
文章平均质量分 70
Neo_226
这个作者很懒,什么都没留下…
展开
-
ID3和C4.5的区别
1.ID3算法存在的缺点(1)ID3算法在选择根节点和各内部节点中的分支属性时,采用信息增益作为评价标准。信息增益的缺点是倾向于选择取值较多的属性,在有些情况下这类属性可能不会提供太多有价值的信息。(2)ID3算法只能对描述属性为离散型属性的数据集构造决策树。2. C4.5算法做出的改进(1) 用信息增益率来选择属性克服了用信息增益来选择属性时偏向选择值多的转载 2015-09-01 13:12:43 · 9789 阅读 · 0 评论 -
数据挖掘—决策树几种方法的比较
1. C&R 树classification and regression trees 是一种基于树的分类和预测方法,模型使用简单,易于理解(规则解释起来更简明易),该方法通过在每个步骤最大限度降低不纯洁度,使用递归分区来将训练记录分割为组。然后,可根据使用的建模方法在每个分割处自动选择最合适的预测变量。如果节点中100% 的观测值都属于目标字段的一个特定类别,则该节点将被认定为“纯洁”。目标转载 2015-09-01 11:55:23 · 3164 阅读 · 0 评论