LGB模型保存及使用

最新推荐文章于 2024-08-07 14:48:28 发布

big_matster

最新推荐文章于 2024-08-07 14:48:28 发布

阅读量3k

点赞数 2

分类专栏：科大讯飞赛场文章标签：决策树 python

本文链接：https://blog.youkuaiyun.com/kuxingseng123/article/details/128768421

版权

科大讯飞赛场专栏收录该内容

15 篇文章

订阅专栏

本文是调参笔记，介绍了竞赛中热门的XGBoost算法存在训练耗时、内存占用大的问题，而LightGBM算法在不降低准确率的前提下，速度更快、内存占用更小。主要讲述了LightGBM的两种调参方法，包括对应不同目的可调整的参数及GridSearchCV调参过程。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1 原生模式
# 模型训练
gbm = lgb.train(params, lgb_train, num_boost_round=20, valid_sets=lgb_eval, early_stopping_rounds=5)
 
# 模型保存
gbm.save_model('model.txt')
 
# 模型加载
gbm = lgb.Booster(model_file='model.txt')
 
# 模型预测
y_pred = gbm.predict(X_test, num_iteration=gbm.best_iteration)
 
2 sklearn接口模式
from lightgbm import LGBMRegressor
from sklearn.metrics import mean_squared_error
from sklearn.model_selection import GridSearchCV
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.externals import joblib
 
 
# 模型训练
gbm = LGBMRegressor(objective='regression', num_leaves=31, learning_rate=0.05, n_estimators=20)
gbm.fit(X_train, y_train, eval_set=[(X_test, y_test)], eval_metric='l1', early_stopping_rounds=5)
 
# 模型存储
joblib.dump(gbm, 'loan_model.pkl')
# 模型加载
gbm = joblib.load('loan_model.pkl')
 
# 模型预测
y_pred = gbm.predict(X_test, num_iteration=gbm.best_iteration_)

调参笔记

在竞赛题中，我们清楚 $XGB oos t$ 算法非常热门。是很多比赛的大杀器。但是在使用过程中，其训练耗时很长，内存占用比较大。在2017年年1月微软在GitHub的上开源了LightGBM。该算法在不降低准确率的前提下，速度提升了10倍左右，占用内存下降了3倍左右。LightGBM是个快速的，分布式的，高性能的基于决策树算法的梯度提升算法。可用于排序，分类，回归以及很多其他的机器学习任务中。其详细的原理及操作内容详见

本文主要将 $L i g h tGBM$ 两种调参方法：
在这里插入图片描述