决策树,属于分类的一种。
经典算法:C4.5.
a) 决策树生成分两步:第一步,决策树生成:由训练样本集生成决策树过程。第二部:决策树的剪枝,对上一阶段生成的决策树进行检验,矫正和修下的过程。
b) 典型算法:ID3,C4.5,CART等。
c) 基本思想:
i. 树以代表训练样本的单个节点开始。
ii. 如果样本都在同一个类,则该几点成为树叶,并用该类标记。
iii. 否则,算法选择最有分类能力的属性作为决策树的当前节点。
iv. 根据当前决策节点属性取值不同,将训练样本数据集分成若干子集,每个取值形成一个分支,有几个取值形成几个分支,
决策树有三种类型节点:1,决策节点:-----用矩形框来表示 2 机会节点-----