随机森林
通过集成多个决策树进行预测。
输入
• 数据:输入数据集
● 预处理器:预处理方法
输出
● 学习器:随机森林学习算法
• 模型:训练好的模型
随机森林是一种集成学习方法,适用于分类、回归等任务。该方法最早由 Tin Kam Ho 提出,后经 Leo Breiman(Breiman, 2001)和 Adele Cutler 进一步完善。
随机森林通过构建多个决策树进行工作。每棵树基于训练数据的自助采样(Bootstrap Sample)生成。在构建单棵树时,每个节点会从随机抽取的属性子集中选择最佳分裂属性(因此称为“随机”)。最终模型通过森林中所有树的多数投票得出结果。
随机森林既可用于分类任务,也可用于回归任务。
- 指定模型名称:默认名称为“随机森林”。
- 基础属性:
● 树的数量:设置森林中包含的决策树数量。
● 每次分裂时考虑的属性数量:设置每