参考文献:https://blog.youkuaiyun.com/Mr_tyting/article/details/72957853
stacking具体的算法流程
以上图为例,我们现在有训练集train_x,train_y,测试集test
① 我们首先选择一种模型比如随机森林rf。(未经训练)
②这里假设把训练集均分成5份,把其中四份作为小的训练集s_train_x,s_train_y另外一份作为小的测试集s_test,测试集test不变。
③我们以s_train_x,s_train_y训练rf模型,训练出的模型预测s_test得出对应的s_pred,再预测test得出y_pred。
④在训练集再选择另外一份作为小的测试集s_test_x,其他四份作为训练集训练模型rf。
⑤重复②,③,④步骤五次。我们会得到五个s_pred和五个y_pred。
五个s_pred作为一个train_X,原始的train_y作为train_Y训练模型得到模型G,五个y_pred取个平均值作为新的test_X,把test_X带入到模型G中得出预测结果。
集成学习-stacking
最新推荐文章于 2025-08-27 13:50:47 发布
本文详细介绍了Stacking集成学习的基本原理及其实现流程。通过将训练集分为多个小部分进行交叉验证,每部分数据用于训练模型并预测剩余部分的数据,最终结合所有模型的预测结果进行二次训练以获得更优的模型。
2792

被折叠的 条评论
为什么被折叠?



