Extremely Randomized Trees(ExrRa Trees)

最新推荐文章于 2024-11-18 14:34:09 发布

转载最新推荐文章于 2024-11-18 14:34:09 发布 · 4.6k 阅读

文章标签：

#算法

结构化同时被 2 个专栏收录

1 篇文章

订阅专栏

算法

1 篇文章

订阅专栏

本文介绍了Extremely Randomized Trees (ExtRaTrees)，一种类似于随机森林的组合方法。它通过进一步增加决策树的随机性来提高预测性能和减少过拟合的风险。文章详细解释了ExtRaTrees与传统随机森林之间的区别。

Extremely Randomized Trees(ExrRa Trees)

今天打kaggle的泰坦尼克的时候，看到了这样一个算法：
ExtRa Trees是Extremely Randomized Trees的缩写，意思就是极度随机树。这是一种组合方法，与其说像决策树，实际上它更像随机森林。

与随机森林的相同点 ：1. bootstrap了样本。2. 随机选取了部分特征，来构造一个棵树。

我们知道随机森林是由很多个随机的决策树组成的，extra trees比随机森林更随机。

与随机森林的不同点：每棵决策树选择划分点的方式不同。对于普通决策树，每个特征都是根据某个标准(信息增益或者gini不纯)去进行划分，比如说一个数值特征的取值范围是0到100，当我们把这个特征划分为0-45，45-100的时候，效果最佳（从信息增益或者gini不纯的角度），决策树就会将45作为划分点；然后再按照某个标准来选择特征。而对于extra trees中的决策树，划分点的选择更为随机，比如一个数值特征的取值范围是0到100，我们随机选择一个0到100的数值作为划分点；然后再按照评判标准选择一个特征。