Python机器学习笔记（五、决策树集成）

FreedomLeo1

于 2024-12-07 17:29:46 发布

阅读量786

点赞数 22

分类专栏： Python机器学习文章标签：机器学习 python 随机森林梯度提升树模型

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/FreedomLeo1/article/details/144311722

版权

集成（ensemble）是合并多个机器学习模型来构建更强大模型的方法。这里主要学习两种集成模型：一是随机森林（random forest）；二是梯度提升决策树（gradient boosted decision tree）。

1. 随机森林

决策树的主要缺点是对训练数据过拟合。随机森林是解决这个问题的一种方法。

随机森林本质上是决策树的集合，每棵树都和其他树略有不同。背后的思想是，每棵树的预测可能都相对较好，但可能对部分数据过拟合，如果构造很多树，并且每棵树的预测都很好，但都以不同的方式过拟合，那么可以对这些树的结果取平均值来降低过拟合。既能减少过拟合又能保持树的预测能力，这可以在数学上严格证明。

随机森林的名字的由来是因为需要将随机性添加到树的构造过程中，确保每棵树都各不相同。随机化方法有两种：一种是通过选择用于构造树的数据点，另一种是通过选择每次划分测试的特征。

构造随机森林：构造的树的个数（RandomForestRegressor 或 RandomForestClassifier 的 n_estimators 参数）。比如我们想要构造5棵树。这些树在构造时彼此完全独立

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

FreedomLeo1 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。