机器学习笔记1_LightGBM算法实践

本文介绍了LightGBM作为GBDT的一种实现,探讨了它的优势,如更快的训练速度、低内存使用和高准确率,并与xgboost进行对比。LightGBM的优化包括基于Histogram的决策树算法和Leaf-wise生长策略,支持类别特征和多线程。

一、LightGBM是什么

LightGBM,英文全称Light Gradient Boosting Machine,本质上与xgboost一样,都是GBDT的算法实现

那么,什么是GBDT呢?
英文全称是Gradient Boosting Decision Tree,本质上是一种Boosting算法的决策树。

那么,什么是Boosting算法呢?
Boosting算法属于集成学习的一种。首先使用初始权重从训练集中训练出一个弱学习器,根据弱学习器的学习误差率来更新样本的权重,提高之前弱学习器学习率较高的训练样本点的权重,使得这些误差率高的样本在后面的弱学习器中得到更多的重视。如此循环,直到得到指定数量的学习器,再通过结合策略进行整合,得到最终的强学习器。

那么,什么是集成学习呢?
通过构建并结合多个机器学习器来完成学习任务,首先通过训练集数据训练得到若干个个体学习器,再通过一定的结合策略,最终形成一个强学习器,达到博采众长的目的。

那么,总得来说,LightGBM是一种基于Boosting算法的集成树模型。

【背景介绍】
LightGBM是微软旗下的Distributed Machine Learning Toolkit (DMKT)的一个项目,由2014年首届阿里巴巴大数据竞赛获胜者之一柯国霖主持开发。虽然其开源时间才仅仅2个月,但是其快速高效的特点已经在数据科学竞赛中崭露头角。Allstate Claims Severity竞赛中的冠军解决方案里就使用了LightGBM,并对其大嘉赞赏。

二、LightGBM的特点

2.1 LightGBM的优势

  1. 更快的训练速度和效率
  2. 更低的内存使用
  3. 更好的准确率
  4. 支持并行化学习
  5. 可以处理大规模数据
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值