接上篇文章:Python——机器学习分类模型实例:从数据预处理到模型训练全流程-优快云博客
本文利用上篇文章中,预处理后的数据,介绍模型融合的 Statcking 和 Voting方法,用以提高模型预测的准确率。Stacking 方法扒了一下sklearn中的源码,其处理方法似乎和大部分原理类文章中讲的不太一样。
0. 保存和读取预处理后的数据
为方便后续利用,可以将上篇文章中预处理后的数据保存为一个新的csv文件。参考代码如下:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
import lightgbm as lgb
from sklearn.ensemble import StackingClassifier
from sklearn.ensemble import VotingClassifier
## 将预处理后的数据保存为新的csv文件
train_pre = pd.concat([x_train,y_train],axis=1)
test_pre = pd.concat([x_test,y_test],axis=1)
train_pre.to_c