随机森林
通过集成多个决策树进行预测。
输入
• 数据:输入数据集
● 预处理器:预处理方法
输出
● 学习器:随机森林学习算法
• 模型:训练好的模型
随机森林是一种集成学习方法,适用于分类、回归等任务。该方法最早由 Tin Kam Ho 提出,后经 Leo Breiman(Breiman, 2001)和 Adele Cutler 进一步完善。
随机森林通过构建多个决策树进行工作。每棵树基于训练数据的自助采样(Bootstrap Sample)生成。在构建单棵树时,每个节点会从随机抽取的属性子集中选择最佳分裂属性(因此称为“随机”)。最终模型通过森林中所有树的多数投票得出结果。
随机森林既可用于分类任务,也可用于回归任务。

- 指定模型名称:默认名称为“随机森林”。
- 基础属性:
● 树的数量:设置森林中包含的决策树数量。
● 每次分裂时考虑的属性数量:设置每个节点随机抽取的属性数量。若未指定(即“属性数量…”选项未勾选),默认值为总属性数的平方根。
● 可复现的训练:固定随机种子,确保结果可重复。
● 平衡类别分布:按类别频率的倒数调整权重,解决类别不平衡问题。
订阅专栏 解锁全文
3731

被折叠的 条评论
为什么被折叠?



