随机森林

最新推荐文章于 2023-08-19 00:37:21 发布

ShenYounger

最新推荐文章于 2023-08-19 00:37:21 发布

阅读量643

点赞数

CC 4.0 BY-SA版权

文章标签：决策树随机森林机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/wusecaiyun/article/details/38677337

随机森林实际上就是决策树的Bagging版本。

当明白如何构造决策树后，就比较容易构造随机森林了。下面是随机森林的构造过程：

1. 假如训练集合中共有N个样本，则有放回的随机选择N个样本。之后用选择好了的N个样本来训练决策树。

2. 当每个样本有M个属性时，在决策树的每个节点需要分裂时，随机从这M个属性中选取出m个属性，满足条件m << M。然后从这m个属性中采用某种策略（比如说信息增益）来选择1个属性作为该节点的分裂属性。

3. 决策树的形成过程中每个节点都按照步骤2进行分裂。一直到不能够再分裂为止。注意整个决策树的形成过程中没有进行剪枝。

4. 按照步骤1~3构造大量决策树，这样就构成随机森林了。

从上面的步骤可以看出，随机森林的随机性体现在每棵树的训练样本是随机的，树中每个节点的分类属性也是随机选择的。有了这2个随机的保证，随机森林就不会产生过拟合的现象了。

随机森林有2个参数需要人为控制，一个是森林中树的数量，一般建议取很大。一个是m的大小，m要远小于M。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。