机器学习中的管道:构建、使用与调优
1. 构建管道
在机器学习中,数据预处理和模型训练通常是一系列连续的步骤。 Pipeline 类可以将这些步骤组合在一起,形成一个单一的估计器。下面以在使用 MinMaxScaler 对数据进行缩放后训练支持向量机(SVM)为例,介绍如何构建管道。
from sklearn.pipeline import Pipeline
from sklearn.preprocessing import MinMaxScaler
from sklearn.svm import SVC
# 构建管道对象
pipe = Pipeline([("scaler", MinMaxScaler()), ("svm", SVC())])
# 拟合管道
pipe.fit(X_train, y_train)
# 评估测试数据
print("Test score: {:.2f}".format(pipe.score(X_test, y_test)))
在这个例子中,我们创建了两个步骤:第一个步骤名为 scaler ,是 MinMaxScaler 的实例;第二个步骤名为 svm ,是 SVC 的实例。 pipe.fit 方法会依次调用每个步骤的 fit 和 transform 方法,最后用缩放后的数据拟合 SVM。调用
超级会员免费看
订阅专栏 解锁全文
1085

被折叠的 条评论
为什么被折叠?



