搞懂一般的stacking和blending只需一张图片,搞不懂我把这张图片的纸吃了!!!

下面再简单参考一下其他博主的对于这两种集成方法的比较:
Blending的优点在于:
1.比stacking简单(因为不用进行k次的交叉验证来获得stacker feature)
2.避开了一个信息泄露问题:generlizers和stacker使用了不一样的数据集
3.在团队建模过程中,不需要给队友分享自己的随机种子
而缺点在于:
1.使用了很少的数据
2.blender可能会过拟合(其实大概率是第一点导致的)
3.stacking使用多次的CV会比较稳健
感觉很多博客都有这段文字,也不知道谁是一开始的原创,就贴我复制的这个博主的链接吧!!
参考文献:https://blog.youkuaiyun.com/sinat_29819401/article/details/71191219
本文通过一张图片帮助理解一般的stacking和blending集成方法,并参考其他博主对二者进行比较。指出blending优点是比stacking简单、避开信息泄露、团队建模无需分享随机种子;缺点是使用数据少、可能过拟合,而stacking多次CV更稳健。
1221

被折叠的 条评论
为什么被折叠?



