模型ensemble

先上两篇写的很好的ensemble文章:

https://mlwave.com/kaggle-ensembling-guide/

https://mlwave.com/human-ensemble-learning/

 

 

ensemble 的一般性方法:

1,voting(投票)

平等投票:n个模型,每个模型投票次数为1,模型关联性越小,投票越有效;

加权投票:n个模型,效果好的可以投票次数多几次,模型关联性越小,投票越有效;

 

2,Averaging

对多个模型的结果做某种权重的平均,最后得到平均后的结果,权重可以想等也可以不相等;

 

3,Bagging,Boosting,Stacking,,,

 

使用python构建预测模型,要求如下:首先读取excel文件中样本数据(共计7项数据),其中ABCD四列作为输入数据,EFG三列为输出数据,再对样本数据进行归一化处理用于作为训练数据。随后构建第一层预测模型:使用轻量化LSTM长短期记忆网络, 克里金Kriging, 支持向量回归SVR三种机器学习方法分别对训练数据3个输出项EFG归一化后对应训练数据构建独立的预测模型LSTM.E.model、LSTM.F.model、LSTM.G.model、Kriging.E.model、Kriging.F.model、Kriging.G.model、SVR.E.model、SVR.F.model、SVR.G.model共9个预测模型。分别给出9个预测模型在均方误差,R²等不同评价标准下对模型准确性的验证结果,并将9个模型数据以.pkl格式文件独立保存。再将9个预测模型进行逆归一化,对归一化后模型在另外保存。分别将EFG三项输出各自对应的三个预测模型进行加权整合成集成预测模型Ensemble.E.model、Ensemble.F.model、Ensemble.G.model其中:Ensemble.E.model=(W.E1)(LSTM.E.model)+(W.E2)(Kriging.E.model)+(W.E3)(SVR.E.model);Ensemble.F.model=(W.F1)(LSTM.F.model)+(W.F2)(Kriging.F.model)+(W.F3)(SVR.F.model);Ensemble.G.model=(W.G1)(LSTM.G.model)+(W.E2)(Kriging.G.model)+(W.G3)*(SVR.G.model),其中W.XX为常数项权值,限制条件为:(0<W.XX<1且W.X1+W.X2+W.X3=1),以决定系数R²作为3个集成预测模型准确性的评级指标。使用PSO粒子群优化算法对W.X1、W.X2、W.X3三个权重值在取值范围内进行搜索,并以R²值趋近于1作为优化目标来确定W.X1、W.X2、W.X3三个权重值最终的数值。(以Ensemble.E.model为例,将通过3个Ensemble.E.model结果与训练数据对比验证得到Ensemble.E.R²,在权值的限制条件范围下使用PSO粒子群优化算法不断调整W.E1、W.E2、W.E3的赋值,来确定使Ensemble.E.R²的值最接近1的W.E1、W.E2、W.E3的赋值值)以上述方法分别来确定Ensemble.E.model、Ensemble.F.model、Ensemble.G.model三个集成预测模型中W.E1、W.E2、W.E3、W.F1、W.F2、W.F3、W.G1、W.G2、W.G3共9个加权的具体数值。并根据确定的加权值赋予Ensemble.E.model、Ensemble.F.model、Ensemble.G.model作为最终生成的3个集成预测模型,将最终的3个集成预测模型以.pkl格式文件独立保存。再将输出项EFG归一化后对应的训练数据与最终的集成预测模型Ensemble.E.model、Ensemble.F.model、Ensemble.G.model两者数据建立3项数据的残差项Res.E、Res.F、Res.G,再使用GA-BP神经网络分别单独学习并构建关联后的训练数据中的输入项与3项数据的残差项Res.E、Res.F、Res.G的预测模型:P_Res.E、P_Res.F、P_Res.G,,其中GA-BP神经网络通过GA遗传算法对BPNN神经网络结构参数进行调整,使P_Res.E/F/G预测模型的准确率最高。最终得出训练数据的3个预测模型为Final.E.model、Final.F.model、Final.G.model,最终预测模型定义为:Final.E/F/G.model=Ensemble.E/F/G.model+P_Res.E/F/G。将最终得出训练数据的3个预测模型为Final.E.model、Final.F.model、Final.G.model以.pkl格式文件独立保存。再将Final.E.model、Final.F.model、Final.G.model三个模型根据样本数据分别对应EFG输出项进行逆归一化处理得到Original.E.model、Original.F.model、Original.G.model也以.pkl格式文件独立保存。流程最后添加输出样本数据每组ABCD四列输入在Original.E/F/G.model预测模型中对应的预测结果。
最新发布
10-31
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值