26、树分类器的原理与应用

树分类器的原理与应用

1. 树分类器基础

树分类器在数据分类领域有着重要的应用。对于基于 $X_1, \cdots, X_k$ 构建的具有 $k + 1$ 个区域的二叉树分类器,当 $k/(n - k) \to 0$(即 $k/n \to 0$)时,$N(X) \to \infty$ 的概率成立。这里的推导借助了切比雪夫不等式:
[
\frac{2Mk}{n} + \sum_{i:n p_i > 2M} \frac{4p_i - \text{Var}{Z_i}}{n} \left(\text{E}{Z_i}\right)^2 < \frac{2Mk}{n} + \sum_{i:n p_i > 2M} \frac{4p_i}{n p_i} < \frac{(2M + 4)k}{n}
]
这一结论表明,我们不必过于关注区域概率质量的大小,区域数量才是更为关键的因素。在很多情况下,基于区域基数的停止规则可以有效舍弃。

2. 平衡搜索树

平衡多维搜索树在计算上具有吸引力。例如,对于每个节点,若每个子树的大小至少是其父节点下另一子树大小的 $\alpha$ 倍($\alpha > 0$ 为常数),那么具有 $n$ 个叶子节点的二叉树高度为 $O(\log n)$。因此,验证用于分类的平衡搜索树的一致性十分重要。

2.1 中位数树

我们考虑具有 $X$ - 属性且在叶子区域进行多数投票的二叉分类树。以中位数树为例,若有 $n$ 个点,我们根据一个坐标找到中位数,创建大小为 $\lfloor(n - 1)/2\rfloor$ 和 $\lceil(n - 1)/2\rceil$

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值