随机森林和决策树调参

本文介绍了随机森林算法中“随机”特性的两方面:利用 Boostrap 方法进行数据集的随机抽样,以及在特征选择上的随机性。此外,还讨论了决策树的分裂停止条件,包括树的最大深度、损失函数的最小值以及节点样本数的最小值。

 

 

随机森林

随机森林的“随机”体现在两个部分:

  • 使用boostrap随机抽样(通俗点说就是有放回的随机抽样),假设原先数据集有N个样本,每次仍然抽出来N个样本,进行M次抽样,组成M个数据集(也就是抽M次,每次抽N个),每个单独的数据集都用来训练一颗单独的决策树T
  • 选取特征进行分裂的时候,随机选取 k 个特征(k是一个小于所有特征总数 P 的值),进行分裂

选取k值的时候,发明随机森林的人推荐如下的取值:

  • 回归:  k = √p
  • 分类: k = p/3

决策树

决策树停止分裂的常用条件:

1.树的深度到达指定最大值

2.损失函数已经到达指定的最小值

3.节点包含的样本数量已经到达指定的最小值

  • 回归: 5个
  • 分类: 1个

转载于:https://www.cnblogs.com/yuuken/p/8715157.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值