【Machine Learning】模型融合之Stacking

Stacking(堆叠泛化)是大数据竞赛中常用的技术,它通过训练多个模型,然后用这些模型的输出作为新数据集,再训练一个元模型进行组合。文章介绍了Stacking的基本概念,并提供了使用mlxtend库实现Stacking的代码示例。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、Stacking简介
  Stacking(stacked generalization)是在大数据竞赛中不可缺少的武器,其指训练一个用于组合(combine)其他多个不同模型的模型,具体是说首先我们使用不同的算法或者其他方法能够训练出多个不同的模型,然后将这些模型的输出作为新的数据集,即将这些训练的模型的输出再作为为输入训练一个模型,最后得到一个最终的输出,下图为Stacking的大致流程图:

这里写图片描述

  如果可以选用任意的组合算法,那么理论上,Stacking可以表示上面提到的各种Ensemble方法。但是在实际应用中通常使用单层logistic回归作为组合模型。

二、代码示例
  在这里使用了mlxtend库,它可以很好地完成对sklearn模型地stacking。

# -*- coding: utf-8 -*-

import pickle
from xgboost import
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值