双向比较分类算法解析
1. 问题背景与定义
在搜索树问题中,通常有两种常见的变体:成功查询变体和标准变体。成功查询变体的输入是一个有序的加权键集合 $K$,每次比较需将查询值与 $K$ 中的特定键进行比较,且查询值必须是 $K$ 中的元素。而标准变体在输入中会为连续键之间的每个开区间赋予一个权重,允许对这些区间内的值进行查询(即不成功查询),并需返回查询值所在的区间。我们所研究的双向比较决策树(2wcdt)的正式定义对这两种变体进行了推广。
对于一个 2wcdt 实例 $(Q, w, C, K)$,其中 $Q$ 是一个全序有限查询集,每个查询 $q$ 都有一个权重 $w(q) \geq 0$;集合 $C \subseteq 2^Q$ 是查询类的集合,每个类都有唯一标识符;$K \subseteq Q$ 是键的集合。设 $n = |Q|$,$m = \sum_{c \in C} |c|$,问题的目标是为该实例计算一个最小成本的双向比较决策树(2wcdt)。
为简化表述,我们主要关注只允许小于和相等测试的决策树模型,不过相关结果可自然扩展到使用其他查询与键之间不等式比较的决策树。
2wcdt 的定义如下:
- 定义 1(2wcdt) :双向比较决策树(2wcdt)是一棵根为二叉树 $T$,每个非叶节点是形如 $\langle < k \rangle$(其中 $k \in K \setminus { \min Q }$)或 $\langle = k \rangle$(其中 $k \in K$)的测试,节点的两个子节点分别标记为两个可能的测试结果(“是”或“否”)。每个叶节点标记为 $C$ 中一个类的标识符,该类必
双向比较分类算法解析
超级会员免费看
订阅专栏 解锁全文
8607

被折叠的 条评论
为什么被折叠?



