pipeline
为方便处理数据,提供了两种模式:串行化和并行化
1、串行化,通过Pipeline类实现
通过steps参数,设定数据处理流程,格式为('key','value'),key为这一step设定的名称,value是对应的处理类。通过list将这些step传入。前n-1个step必须为transform函数,最后的step可有可无,一般为模型,pipeline继承了最有一个函数的所有方法。
from sklearn.pipeline import Pipeline
from sklearn.svm import SVC
from sklearn.feature_selection import SelectKBest
from sklearn.feature_selection import f_regression
from sklearn.datase