机器学习之集成算法随机森林 sklearn

最新推荐文章于 2023-12-19 18:05:55 发布

阿唐明

最新推荐文章于 2023-12-19 18:05:55 发布

阅读量410

点赞数

CC 4.0 BY-SA版权

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/persistinlife/article/details/88261193

本文介绍了集成学习的三种主要方法：Bagging、Boosting和Stacking，并以随机森林为例，详细讲解了其工作原理。随机森林是一种基于Bagging的算法，通过数据的随机抽样和特征选择构建多个决策树，最后通过投票或平均决定最终结果。此外，文章还利用泰坦尼克号数据集展示了随机森林的实际应用，包括数据预处理和模型构建过程。

Bagging
Boosting
Stacking
代码演示

集成算法目的：简单来说就是构建并结合多个学习分类器来完成学习任务，也称为多分类器系统。
例如：有分类任务，使用A分类器和B分类器分别做分类，再结合结果输出。当然有多种模式。

1.Bagging

训练多个分类器取平均值
$\frac{1}{M} \sum_{m=1}^M f(x)$

也就是并行进行一堆分类器，最后求平均
代表的算法就是随机森林，各个tree之间不影响。
随机：数据随机采样（数据有放回的随机采样，特征采集随机采集）
在这里插入图片描述

2.Boosting

从弱学习器开始加强，通过加权来进行训练（类似与串行运行）

最低0.47元/天解锁文章

新学期VIP享超值加赠

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。