决策树是在已知各种情况发生概论的基础上,通过构成决策树来求取净现值的期望值大于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。由于这种决策分治画成图形很像一棵树的枝干,故称决策树。
决策树是一个预测模型,它代表的是对象属性和对象值的一种映射关系。树地每个节点表示某个对象,每个分叉路径则代表某个可能的属性值,而每个叶节点则对应从根节点到该叶节点所经历的路径所表示的对象的值。
优点:1.易于理解和实现。
2.数据准备往往是简单或者不必要的,而且能同时处理数据型和常规型属性,能在相对短的时间对大量数据源做出可行且效果良好效果。
3.易于通过静态测试来对模型进行评测,可以测定模型可信度。可根据观察模型所产生的决策树很容易推出相应的逻辑表达式。
缺点:1.对连续性字段较难预测。
2.对有时间顺序的数据需要很多预处理工作。
3.类别太多时,错误可能会增加较快。
4.一般算法分类时,只是根据一个字段来分类。
决策表又称判断表,是一种呈表格状的图形工具,适用于描述处理判断条件较多,各条件又相互组合、有多种决策方案的情况。其能将多个独立条件和多个动作直接地联系清晰的表示出来。
决策表四结构:
候选条件:每个条件对应变量、关系或预测所以可能的值。
动作:要执行的过程或操作。
动作入口:根据该入口所对应的候选条件集,是否或按怎样的顺序执行动作。
“不关心”符号:简化决策表。
优点:能罗列所有可能情况,并清晰地指出相应处理方式,便于观看理解,也避免在程序语言编写中因为逻辑的嵌套而产生遗漏。