Sklearn自定义实现GridSearch

最新推荐文章于 2025-02-22 19:15:31 发布

原创

最新推荐文章于 2025-02-22 19:15:31 发布 · 429 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#sklearn #机器学习 #python

本文介绍了如何使用Sklearn的ParameterGrid实现一个自定义GridSearch函数，允许用户设置自己的评价指标，并在固定验证集上选择最优模型。示例展示了在SVM场景下的应用，但文章结论指出固定验证集可能引发过拟合，建议在数据处理上做好优化。

引言：本文旨在利用Sklearn中的ParameterGrid来实现一个自定义化的网格搜索（GridSearch）函数，应用场景的话是可以自定义评价指标、同时能够在固定的验证集而非默认使用K-fold进行最优模型保存。

问题概述

网格搜索（GridSearch）可以帮助我们确定最优的模型参数，但它的封装程度较高，难以进行自定义的评价指标设置；此外默认使用K-fold来选取最优参数也比较烦人。因此本文设计的自定义GridSearch流程实现了在固定的evaluation set进行最优模型的选取。

设计思路

设计流程和原始的GridSearch一致，主要是利用了Sklearn中原本就有的ParameterGrid来生成一系列的候选参数，循环创建对应的模型，在验证集上评估模型的效果并保存系列模型的得分，最终选取最优模型。代码如下：

def custom_GridSearch(params,model,train_feature,train_label,eval_feature,eval_label,criterion):
    from sklearn.model_selection import ParameterGrid
    candidatas=ParameterGrid(params)
    result={
   
   }

    for i in range(candidatas.__len__

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

夜半罟霖

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

详解| Sklearn—GridSearch 调参函数

ScarlettYellow的博客

05-25

5909

Abstract：GridSearch是Sklearn里的一个调参函数。本文是对此函数的详细解释。1.参数搜索参数并非从estimators中直接学到的，可以通过设置一个参数搜索空间来找到最佳的cross-validation score。通常示例包括的参数有：SVM分类器的中C、kernel和gamma，Lasso中的alpha等。当构建一个estimator时，提供的参数可以以这种方式进行优化...

sklearn基础篇（八）-- 网格搜索与随机搜索

CarpeDiem

12-14

4756

网格搜索适用于三四个（或者更少）的超参数（当超参数的数量增长时，网格搜索的计算复杂度会呈现指数增长，这时候则使用随机搜索），用户列出一个较小的超参数值域，这些超参数至于的笛卡尔积（排列组合）为一组组超参数。网格搜索算法使用每组超参数训练模型并挑选验证集误差最小的超参数组合。

参与评论您还未登录，请先登录后发表或查看评论

在sklearn中如何实现参数网格搜索（GridSearch）？

2401_85761762的博客

06-20

2058

是sklearn中的一个类，用于通过网格搜索（Grid Search）方法来寻找最优的模型超参数。它通过遍历给定的参数网格，对每一组参数进行交叉验证，并根据评分标准选择出最优的参数组合。

sklearn svm 调参_用 Grid Search 对 SVM 进行调参

weixin_42419508的博客

01-12

676

上一次用了验证曲线来找最优超参数。今天来看看网格搜索(grid search)，也是一种常用的找最优超参数的算法。网格搜索实际上就是暴力搜索：首先为想要调参的参数设定一组候选值，然后网格搜索会穷举各种参数组合，根据设定的评分机制找到最好的那一组设置。以支持向量机分类器 SVC 为例，用 GridSearchCV 进行调参：fromsklearnimportdatasetsfromsklea...

sklearn Grid Search 网格搜索

FX=X 学习笔记

03-10

2513

1. 定义 Grid Search：选取模型的最优超参数、通过优化超参数之间的最优组合来改善模型性能。（获取最优超参数的方式可以绘制验证曲线，但是验证曲线只能每次获取一个最优超参数。如果多个超参数有很多排列组合的话，就可以使用网格搜索寻求最优超参数的组合。）（为什么叫网格搜索？以有两个参数的模型为例，参数a有3种可能，参数b有4种可能，把所有可能性列出来，可以表示成一个3*4的表格，其中...

sklearn 创建自己的估计器 自定义estimators scikit-learn python

Yummy_Ou

02-07

3037

I should write an ELM_Estimator by inheriting the parent class BaseEstimator, RegressorMixin so that I can directly use GridSearchCV from sklearn more easily. References 非常详细的sklearn介绍 ...

机器学习模型训练超参数优化使用sklearn库里网格搜索（Grid Search）方法所有参数含义解释

热门推荐

selous的专栏

04-18

2万+

cross-validation(交叉验证) A solution to this problem is a procedure called cross-validation (CV for short). A test set should still be held out for final evaluation, but the validation set is no longer

from sklearn.grid_search import GridSearchCV This module was deprecated in version 0.18

蝉之洞

04-24

2947

环境：scikit-learn 0.18 , python3from sklearn.cross_validation import train_test_split from sklearn.grid_search import GridSearchCV 报出如下警告：from sklearn.grid_search import GridSearchCV /usr/lib/python3.4/...

算法模型自动超参数优化方法！

Datawhale

12-22

6243

什么是超参数？学习器模型中一般有两类参数，一类是可以从数据中学习估计得到，我们称为参数（Parameter）。还有一类参数时无法从数据中估计，只能靠人的经验进行设计指定，我们称为超参数（...

from sklearn.grid_search import GridSearchCV 找不到了

凡森

06-11

1万+

问题 from sklearn.grid_search import GridSearchCV https://scikit-learn.org/0.17/modules/generated/sklearn.grid_search.GridSearchCV.html 原因：版本老了不支持了艹解决 from sklearn.model_selection import GridSearch...

scikit-learn（sklearn）库中的网格搜索（Grid Search）自动化的方法来搜索最佳参数组合

高级数据分析师，分享Python知识

08-18

1673

在机器学习中，调参是一个非常重要的步骤，它可以帮助我们找到最优的模型参数，从而提高模型的性能。然而，手动调参是一项繁琐且耗时的工作，因此，我们需要一种自动化的方法来搜索最佳参数组合。在这方面，scikit-learn（sklearn）库中的网格搜索（Grid Search）功能为我们提供了一个便捷的解决方案。网格搜索是一种通过遍历给定的参数组合来寻找最佳参数的方法。它的基本思想是将参数空间划分为一个个网格，然后在每个网格中进行模型训练和评估，最终找到最佳参数组合。

sklearn 之调参GridSearchCV

Graceguanguan的博客

03-14

342

sklearn.model_selection.GridSearchCV

sklearn —— GridSearchCV进行超参数优化

starter_____的博客

02-18

4140

超参数：即不直接在估计器内学习的参数。在 scikit-learn 包中，它们作为估计器类中构造函数的参数进行传递。超参数优化：搜索超参数空间以便获得最好交叉验证分数 sklearn.model_selection.GridSearchCV 通过参数网格上的交叉验证网格搜索对估算器的指定参数值进行详尽搜索。常用参数列表参数名称参数类型作用 e...

sklearn学习——SVM例程总结(PCA+Pipline+cv+GridSearch)

sqiu_11的博客

07-26

3696

Introduction 其实对于SVM调节超参数不需要这么复杂，因为gamma可能更重要一点，固定C=1，手动调节gamma即可。此外，sklearn的网格搜索极其的慢，下面的代码出来结果至少要半个多小时，如果有经验根本不需要。对于有经验的人来说或许看学习曲线就能知道调什么参数。但是为什么还要这么做呢？可能是为了装吧，或许更直观一点，不需要老中医式的随便开点良药，看看效果再换药了！ PCA：

机器学习系列十九：sklearn-GridSearchCV

qq_36086861的博客

11-13

2164

一、简介 GridSearchCV，它存在的意义就是自动调参，只要把参数输进去，就能给出最优化的结果和参数。但是这个方法适合于小数据集，一旦数据的量级上去了，很难得出结果。这个时候就是需要动脑筋了。数据量比较大的时候可以使用一个快速调优的方法——坐标下降。它其实是一种贪心算法：拿当前对模型影响最大的参数调优，直到最优化；再拿下一个影响最大的参数调优，如此下去，直到所有的参数调整完毕。 Rand...

如何在sklearn的GridSearchCV中自定义评估标准以优化模型性能？请提供详细步骤和代码示例。

10-30

在使用sklearn的GridSearchCV进行模型选择和调参的过程中，自定义评估标准是优化模型性能的关键步骤。为了深入了解如何实现这一点，建议参阅《sklearn模型评估：score, scoring参数与metric函数详解》。这本书详细阐述了score方法、scoring参数以及metric函数的使用，将帮助你更好地掌握自定义评估标准的技巧。参考资源链接：[sklearn模型评估：score, scoring参数与metric函数详解](https://wenku.youkuaiyun.com/doc/537f0fin08) 首先，你需要定义一个评分函数或使用sklearn.metrics中提供的函数。例如，如果你想要优化模型的平均绝对误差（MAE），你可以使用mean_absolute_error函数。接着，你需要使用make_scorer函数来创建一个scorer对象，该对象能够将你的自定义评估函数适配到GridSearchCV中。以下是使用自定义评估标准进行模型调优的步骤和示例代码： 1. 导入必要的模块和函数： ```python from sklearn.model_selection import GridSearchCV from sklearn.metrics import mean_absolute_error, make_scorer ``` 2. 定义自定义评估函数： ```python def custom_metric_function(y_true, y_pred): # 这里计算你想要的指标，例如 MAE return mean_absolute_error(y_true, y_pred) ``` 3. 使用make_scorer创建一个scorer对象： ```python custom_scorer = make_scorer(custom_metric_function, greater_is_better=False) ``` 注意，由于MAE越小越好，我们设置greater_is_better=False。如果你的评估标准越高越好，比如准确率，应设置greater_is_better=True。 4. 在GridSearchCV中使用自定义scorer进行模型优化： ```python from sklearn.datasets import make_classification from sklearn.linear_model import LogisticRegression from sklearn.model_selection import train_test_split # 创建一个示例数据集 X, y = make_classification(n_samples=1000, n_features=20, random_state=42) # 划分训练集和测试集 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42) # 初始化分类器 clf = LogisticRegression() # 定义参数网格 param_grid = { 'C': [0.1, 1, 10, 100], 'penalty': ['l1', 'l2'] } # 使用GridSearchCV和自定义scorer grid_search = GridSearchCV(estimator=clf, param_grid=param_grid, scoring=custom_scorer, cv=5) # 运行网格搜索 grid_search.fit(X_train, y_train) # 输出最佳参数和对应的MAE评分 print( 参考资源链接：[sklearn模型评估：score, scoring参数与metric函数详解](https://wenku.youkuaiyun.com/doc/537f0fin08)