26、树分类器的原理与应用

l6m7n8

于 2025-10-24 10:00:44 发布

阅读量11

点赞数

CC 4.0 BY-SA版权

分类专栏：模式识别的概率艺术文章标签：树分类器中位数树 k-d树

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/l6m7n8/article/details/154901615

模式识别的概率艺术专栏收录该内容

49 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

树分类器的原理与应用

1. 树分类器基础

树分类器在数据分类领域有着重要的应用。对于基于 $X_1, \cdots, X_k$ 构建的具有 $k + 1$ 个区域的二叉树分类器，当 $k/(n - k) \to 0$（即 $k/n \to 0$）时，$N(X) \to \infty$ 的概率成立。这里的推导借助了切比雪夫不等式：
[
\frac{2Mk}{n} + \sum_{i:n p_i > 2M} \frac{4p_i - \text{Var}{Z_i}}{n} \left(\text{E}{Z_i}\right)^2 < \frac{2Mk}{n} + \sum_{i:n p_i > 2M} \frac{4p_i}{n p_i} < \frac{(2M + 4)k}{n}
]
这一结论表明，我们不必过于关注区域概率质量的大小，区域数量才是更为关键的因素。在很多情况下，基于区域基数的停止规则可以有效舍弃。

2. 平衡搜索树

平衡多维搜索树在计算上具有吸引力。例如，对于每个节点，若每个子树的大小至少是其父节点下另一子树大小的 $\alpha$ 倍（$\alpha > 0$ 为常数），那么具有 $n$ 个叶子节点的二叉树高度为 $O(\log n)$。因此，验证用于分类的平衡搜索树的一致性十分重要。

2.1 中位数树

我们考虑具有 $X$ - 属性且在叶子区域进行多数投票的二叉分类树。以中位数树为例，若有 $n$ 个点，我们根据一个坐标找到中位数，创建大小为 $\lfloor(n - 1)/2\rfloor$ 和 $\lceil(n - 1)/2\rceil$

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。