【机器学习系列1】Xgboost算法


http://skyhigh233.com/blog/2016/12/01/gbdt-and-xgboost/


RF、GBDT和xgboost

  • RF:从M个训练样本中随机选取m个样本,从N个特征中随机选取n个特征,然后建立一颗决策树。这样训练出T棵树后,让这k颗树对测试集进行投票产生决策值。RF是一种bagging的思路。可以并行化处理。

  • GBDT:总共构建T棵树。当构建到第t棵树的时候,需要对前t-1棵树对训练样本分类回归产生的残差进行拟合。每次构建树的方式以及数据集一样,只不过拟合的目标变成了t-1棵树输出的残差。不可并行化处理。

  • xgboost:总共构建T颗树。当构建到第t颗树的时候,需要对前t-1颗树对训练样本分类回归产生的残差进行拟合。每次拟合产生新的树的时候,遍历所有可能的树,并选择使得目标函数值(cost)最小的树。但是这样在实践中难以实现,因此需要将步骤进行分解,在构造新的树的时候,每次只产生一个分支,并选择最好的那个分支。如果产生分支的目标函数值(cost)比不产生的时候大或者改进效果不明显,那么就放弃产生分支(相当于truncate,截断)。可以并行化处理,效率比GBDT高,效果比GBDT好。

xgboost原理

xgboost的模型——Tree Ensemble






评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值