模型融合方法总结

Blending与Stacking大致相同,只是Blending的主要区别在于训练集不是通过K-Fold的CV策略来获得预测值从而生成第二阶段模型的特征,而是建立一个Holdout集,例如说10%的训练数据,第二阶段的stacker模型就基于第一阶段模型对这10%训练数据的预测值进行拟合。说白了,就是把Stacking流程中的K-Fold CV 改成 HoldOut CV。


1、特征准备,使用模型训练出第一步数据集合: 首先使用k-fold训练集,得到k(train,test)组训练,测试数据,使用训练数据训练出的模型,test测试数据的分类概率,依次循环完所有训练数据,得到一维特征,依次n种训练模型,将模型预测最初的测试数据得出预测概率,为待测试数据集合Y,得出n维特征预测概率X。

2、模型预测,使用集成模型对第一步中训练出的X,Y进行训练,得出一个升级模型,最终使用这个模型来预测数据test。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值