1.理论部分
随机森林(Random Forest),顾名思义,就是由很多决策树模型融合在一起的算法。
随机森林是一种运用了集成学习(ensemble learning)的决策树分类器。
- 随机森林是一种基于Bagging框架的模型融合算法,如图1.2所示。它通过多个基础的决策树模型进行训练,如何通过结合模块将多个分类器训练得到的结果进行融合最终得到预测结果
- 随机森林的“森林”指的就是它的弱模型是由决策树算法训练的(具体是CART算法),CART算法既能做分类也能做回归(CART算法详情可见上述决策树章节)
- 随机森林的“随机”指的是构造的若干个弱模型是有一定的“随机性”的

图1.2
1.1 随机森林的“随机”性体现在:
- 子模型的训练样本是随机抽取的

图1.3
对于包含 n 个样本的数据集,我们先分n次随机有放回地采样出n个样本,组成采样集。由于是 n次有放回
本文详述了随机森林的理论与实践,包括其随机性的体现、模型结合方式,并通过Python代码演示了鸢尾花卉品种预测,使用了随机森林、逻辑回归等机器学习算法,同时讨论了模型参数调整,如n_estimators和random_state。
订阅专栏 解锁全文
938

被折叠的 条评论
为什么被折叠?



