本文为本人另两篇博客机器学习/计算机视觉(cv)实习面试资料整理(附字节、阿里、腾讯、美团面经)、机器学习知识点整理以及集成树知识点概括下的子内容,有需要的朋友按需自取~
另:本文只是知识点的整理概括,更为详细的可以参考我每个部分给出的链接~
详细介绍参考LightGBM算法总结
概述
- LightGBM(Light Gradient Boosting Machine) 提出的主要原因就是为了解决 GBDT 在海量数据遇到的问题,让 GBDT 可以更好更快地用于工业实践;
- 基于决策树算法的分布式梯度提升框架;
- 通过部分样本计算信息增益:
1)LGB选择梯度大的样本来计算信息增益;
2)在保留大梯度样本的同时,随机地保留一些小梯度样本,同时放大了小梯度样本带来的信息增益;
3)首先把样本按