(四)模型融合方法总结

模型融合:对调参完成的模型进行融合,一般在整个过程的后期进行,基于多个比较好的模型,融合后才有好的效果。

方法:

  1. 简单加权融合:

    回归(分类概率):
    算术平均融合(Arithmetic mean),几何平均融合(Geometric mean);权重的差异不要太大

    分类模型:
    投票(Voting),分为硬投票和软投票,原理是少数服从多数。硬投票:对多个模型直接进行投票,不区分模型结果的相对重要度,最终投票数最多的类为最终被预测的类。软投票:增加了设置权重的功能,可以为不同模型设置不同权重,进而区别模型不同的重要度

    综合:
    排序融合(Rank averaging),log融合

  2. Stacking/Blending:
    构建多层模型,并利用预测结果再拟合预测。
    先学习一个初级的模型,然后用初级的模型训练次级的模型,从而得到完整的stacking模型。
    为了防止过拟合,通常次级的模型尽量选择简单的线性模型

  3. boosting/bagging(在xgboost,Adaboost,GBDT中已经用到):
    多树的提升方法

不同的方法需要多尝试才知道结果,有时简单融合不容易过拟合。

示例:
继续之前的(二)特征工程之后,
构建XGBoost、LightGBM、GBDT三个模型,

def build_model_gbdt(x_train,y_train):
    estimator =GradientBoostingRegressor(loss='ls',subsample= 0.85,max_depth= 5,n_estimators = 100)
    param_grid = {
   
    'learning_rate': [0.05,0.08,0.1,0.2],
    
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值