8、机器学习超参数调优与下注规模确定

最新推荐文章于 2025-12-27 10:06:03 发布

http9protocoller

最新推荐文章于 2025-12-27 10:06:03 发布

阅读量21

点赞数

CC 4.0 BY-SA版权

分类专栏：金融机器学习的破局之道文章标签：机器学习超参数调优网格搜索交叉验证

本文链接：https://blog.youkuaiyun.com/http9protocoller/article/details/152387380

金融机器学习的破局之道专栏收录该内容

19 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

机器学习超参数调优与下注规模确定

超参数调优

动机

超参数调优是拟合机器学习算法的关键步骤。若调优不当，算法易过拟合，实际表现会令人失望。机器学习领域特别重视对调优后的超参数进行交叉验证。在金融领域，交叉验证是个难题，其他领域的方法可能并不适用。

网格搜索交叉验证

网格搜索交叉验证会根据用户定义的评分函数，对所有参数组合进行穷举搜索，以找到使交叉验证性能最大化的组合。当对数据的底层结构了解不多时，这是一种合理的初始方法。Scikit - learn 中的 GridSearchCV 函数实现了这一逻辑，为防止其对泄露信息过拟合，需传入 PurgedKFold 类。

def clfHyperFit(feat,lbl,t1,pipe_clf,param_grid,cv=3,bagging=[0,None,1.],
n_jobs=-1,pctEmbargo=0,**fit_params):
    if set(lbl.values)=={0,1}:scoring='f1' # f1 for meta-labeling
    else:scoring='neg_log_loss' # symmetric towards all cases
    #1) hyperparameter search, on train data
    inner_cv=PurgedKFold(n_splits=cv,t1=t1,pctEmbargo=pctEmbargo) # purged
    gs=GridSearchCV(es