随机森林算法（RF）和LightGBM

最新推荐文章于 2025-04-07 23:27:35 发布

蜡笔小潘和野原小白

最新推荐文章于 2025-04-07 23:27:35 发布

阅读量4.4k

点赞数 1

分类专栏：机器学习

本文链接：https://blog.youkuaiyun.com/weixin_45242264/article/details/107716042

版权

本文介绍了随机森林算法，包括其作为套袋法（Bagging）的一部分，以及其基于决策树的构建过程和特点。随机森林具有高准确率、抗过拟合能力强等优点，但也存在训练成本高等缺点。此外，文章还提到了LightGBM算法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

随机森林算法（RF）和LightGBM

一、随机森林算法（RF）
二、LightGBM

一、随机森林算法（RF）

1.1、简介

在集成学习中，主要分为套袋法（Bagging）和提升法（Boosting），其中随机森林属于套袋（bagging）算法。

在机器学习中，随机森林指的是利用多棵树对样本进行训练并预测的一种分类器，包含多个决策树，并且输出的类别由个别树输出的类别的众数而定。

1.2、 Bagging（套袋法）

Bagging的算法过程如下：
1.对原始样本集中使用Bootstraping方法随机抽取n个训练样本，进行k轮抽取，得到k个训练集。（k个训练集之间相互独立，元素可以有重复）
2.对于k个训练集，训练k个模型（根据具体问题而定，比如决策树，knn等）
3.对于分类问题，由投票表决产生分类结果；对于回归问题：由k个模型预测结果的均值作为最后预测结果