实例:销售调查例子(对潜在客户进行分类,给出销售人员指导意见)
销售调查表:

销售调查决策树:

上面仅是从定性的角度对潜在用户的判断,下面加上定量的判断:

决策树的
算法框架:
- 决策树的主函数:各种决策树的主函数大同小异,本质上是个递归函数,该函数主要功能是根据某种规则生长出决策树的各个分支节点,并根据终止条件结束算法。
-
- 输入需要分类的数据集和类别标签
- 根据某种分类规则得到最优的划分特征,并创建特征的划分节点——计算最优特征子函数
- 按照该特征的每个取值划分数据集为若干部分——划分数据集子函数
- 根据划分子函数的计算结果构建出新的节点,作为树生长出的新分支
- 检验是否符合递归终止条件
- 将划分的新节点包含的数据集和类别标签作为输入,递归执行上述步骤
- 计算最优特征子函数:不同标准导致不同类型的决策树,如ID3的最优特征选择标准是信息增益,C4.5是信息增益率,CART是节点方差的大小等等。算法逻辑上,一般选择最优特征需要遍历整个数据集