决策树与四叉树的优化研究
1. 决策树集合的表示
1.1 构建图 Δ(T) 的算法
为了表示决策表 T 的所有决策树集合,我们构建图 Δ(T)。该图的节点是决策表 T 的可分子表。算法步骤如下:
1. 初始时,图仅包含一个节点 T。
2. 每一步处理一个节点,并标记为 。
3. 若已执行 p 步,进行第 (p + 1) 步:
- 若所有节点都已处理,算法结束,得到图 Δ(T)。
- 否则,选择一个未处理的节点 Θ。设 b 是 Θ 中最常见的决策。
- 若 R(Θ) = 0,将节点 Θ 标记为 b,标记为 ,然后进入第 (p + 2) 步。
- 若 R(Θ) > 0,对于每个 fi ∈ E(Θ),从节点 Θ 绘制一组边(称为 fi - 束)。设 E(Θ, fi) = {a1, …, at},绘制 t 条边,分别标记为 (fi, a1), …, (fi, at),这些边指向节点 Θ(fi, a1), …, Θ(fi, at)。若某些节点不在图中,则将其添加到图中。标记节点 Θ 为 *,进入第 (p + 2) 步。
1.2 对应节点的决策树集合
对于图 Δ(T) 的每个节点 Θ,我们从标记数字的终端节点向节点 T 移动,描述对应节点 Θ 的决策树集合:
- 若 Θ 是标记数字 b 的终端节点,对应图 1 所示的平凡决策树。
- 若 Θ 是非终端节点,有若干从 Θ 出发的边束。考虑任意一个 fi - 束,设 E(Θ, fi) = {a1, …, at},Γ1, …, Γt 是对应节点 Θ(fi, a1), …, Θ(fi, at) 的决策树,则