机器学习笔记之十五——lightgbm之直方图算法

本文深入探讨了LightGBM中max_bin参数的作用与意义,解释了它如何通过控制特征值的桶数来平衡训练精度与泛化能力,以及如何影响内存压缩。文章回顾了直方图算法,帮助读者理解max_bin参数的具体工作原理。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

  lightgbm使用时有一个参数“max_bin”一直在用,但是一直比较模糊,于是想搞它一搞。

  max_bin官方文档的解释:

max number of bins that feature values will be bucketed in
small number of bins may reduce training accuracy but may increase general power (deal with over-fitting)
LightGBM will auto compress memory according to max_bin. For example, LightGBM will use uint8_t for feature value if max_bin=255

 要明白max_bin必须明白直方图算法,复习一下。

直方图算法

  

 

那么max_bin就可以理解了,如果len(bins) 大于 max_bin,那么较小梯度和的bins们就会被抛弃,这样一定程度上提高了泛化能力。 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值