文章大纲 随机森林算法 源代码 参考文献 随机森林算法 树相关的基础知识: 面试、笔试题集:集成学习,树模型,Random Forests,GBDT,XGBoost 源代码 spark 随机森林的训练步骤 具体的训练步骤如下: 1.将每个树模型的根节点取出,加入栈中 2.将k个节点从栈中取出,组成一个训练集合group,k值由内存限制决定,确定特征采样 3.从各分区上计算并汇合分布信息,并计算待切分节点的最优切分点 4.根据切分点生成新的叶子节点,并更新nodeIdCache 5.若新生成的叶子节点没有达到最小不纯度限制和最小样本数量的限制,则入栈 6.若栈非空 goto 2. 7.剪枝合并多余节点,结束