决策树归纳与规则归纳方法解析
1. 决策树归纳
决策树是一种以树状形式呈现的图形分类模型,其基本组成元素如下:
- 每个内部(非叶子)节点都标有一个预测属性的名称。
- 从内部节点引出的分支标有该节点所标记属性的值。
- 每个叶子节点都标有一个类别。
例如,有一个简单的决策树,预测属性为“Salary”(薪水)和“Age”(年龄),类别为“yes”和“no”,用于判断客户是否会购买某一产品。
当使用决策树对一个示例进行分类时,会将该示例沿着树向下推进,遵循属性值与示例属性值相匹配的分支,直到示例到达一个叶子节点,此时该叶子节点的类别就会被分配给该示例。比如,对于上述决策树,若示例(客户)的“Salary = high”,则无论客户的年龄如何,都会被分配“yes”类别;若“Salary = medium”且“Age = 32”,则会被分配“no”类别。
决策树可以直接转换为另一种分类模型,即使用一组“if - then”分类规则的知识表示形式。具体做法是为决策树中从根节点到叶子节点的每条路径创建一个“if - then”规则,规则数量与叶子节点数量相同。每条规则的前件(“if”部分)由该路径上节点和分支中的所有属性及对应值组成,后件(“then”部分)则预测该路径末端叶子节点的类别。例如,上述决策树可转换为以下规则:
IF (Salary = low) THEN (Buy = no)
IF (Salary = medium) AND (Age ≤25) THEN (Buy = yes)
IF (Salary = medium) AND (Age >
超级会员免费看
订阅专栏 解锁全文
22

被折叠的 条评论
为什么被折叠?



