一、学习要求
用目前评分最高的模型作为基准模型,和其他模型进行stacking融合,得到最终模型及评分
二、基础知识
我们使用 m 个算法,分别求出对于我们数据而言,相对的预测结果 P1、P2 … Pm,我们不直接使用这三个预测结果进行综合来得到预测结果。而是将这个 m 个预测结果作为输入,再添加一层算法 Meta-Classifer,训练一个新的模型,用这个新的模型的输出作为我们最终的预测结果。
三、实现过程
使用我们在上个博客得到的最优模型进行stacking
from sklearn import datasets
from sklearn import svm
from sklearn.svm import LinearSVC
from sklearn import model_selection
from sklearn.linear_model import LogisticRegression
from sklearn.neighbors import KNeighborsClassifier
from sklearn.naive_bayes import GaussianNB
from xgboost import XGBClassifier
from lightgbm import LGBMClassifier
from sklearn.ensemble import RandomForestClassifier
from mlxtend.classifier import StackingClassifier
import numpy as np
clf1 = svm.SVC(kernel = 'linear', probability=True)
clf2 = svm.SVC(kernel='poly', probability=