无监督随机森林学习在交通场景分类中的应用
1. 树的生长
在实际应用中,所需的概率密度函数往往是未知的。因此,我们需要考虑如何利用给定的数据集 $D_s$ 进行分割。由于概率函数 $p(x \in t)$ 未知,我们使用包含 $M$ 个数据点的训练数据集 $D_s$ 来近似它。
我们定义集合 $M(t) = {m \in M : x_m \in t}$,它包含了节点 $t$ 中数据集 $D_s$ 的所有数据点。那么经验估计 $\hat{p}(x \in t)$ 可以通过以下公式计算:
[
\hat{p}(x \in t) = \frac{|M(t)|}{M} = \frac{M(t)}{M}
]
其中假设对于所有 $t \in \tilde{T}$,都有 $\hat{p}(x \in t) > 0$。
接下来,我们可以重新表述一些公式:
- $\hat{r} {min}(t) = \min {\upsilon} \frac{\sum_{M(t)} L(y_m, \upsilon(\rho(x_m)))}{M(t)}$
- $\hat{R} {min}(f) = \sum {\tilde{T}} \hat{r}_{min}(t) \hat{p}(x \in t)$
对于回归问题,我们设 $\upsilon = \hat{\mu}(t)$,则 $\hat{r} {min}(t) = \hat{\sigma}^2 {\tilde{T}}(t)$,其中 $\mu$ 和 $\sigma^2$ 分别表示期望和方差。
对于分类问题,
超级会员免费看
订阅专栏 解锁全文

37

被折叠的 条评论
为什么被折叠?



