机器学习中的管道与文本数据处理
1. 管道在机器学习中的应用
在机器学习工作流中,往往涉及多个处理步骤,而管道(Pipeline)类是将这些步骤链接在一起的通用工具。以癌症数据集为例,我们可以按以下步骤实例化并运行网格搜索:
X_train, X_test, y_train, y_test = train_test_split(
cancer.data, cancer.target, random_state=0)
grid = GridSearchCV(pipe, param_grid, cv=5)
grid.fit(X_train, y_train)
print("Best params:\n{}\n".format(grid.best_params_))
print("Best cross-validation score: {:.2f}".format(grid.best_score_))
print("Test-set score: {:.2f}".format(grid.score(X_test, y_test)))
运行结果如下:
Best params:
{'classifier':
SVC(C=10, cache_size=200, class_weight=None, coef0=0.0,
decision_function_shape=None, degree=3, gamma=0.01, kernel='rbf',
max_iter=-1, probability=False, random_state=None,
超级会员免费看
订阅专栏 解锁全文
2717

被折叠的 条评论
为什么被折叠?



