跟我学算法-xgboost(集成算法)基本原理推导

最新推荐文章于 2025-09-10 22:07:12 发布

weixin_34144848

最新推荐文章于 2025-09-10 22:07:12 发布

阅读量104

点赞数

CC 4.0 BY-SA版权

文章标签：人工智能

原文链接：http://www.cnblogs.com/my-love-is-python/p/9786390.html

本文详细解析了XGBoost算法的工作原理，包括构造损失函数、泰勒展开、叶子节点遍历、正则化惩罚项的合并，以及通过求导找到最优参数的过程。并通过实例展示了如何利用目标函数值的变化进行样本分割，实现最大信息增益。

1.构造损失函数的目标函数

2.对目标函数进行泰勒展开

3.把样本遍历转换成叶子节点遍历，合并正则化惩罚项

4.求wj进行求导，使得当目标函数等于0时的wj的值

5.将求解得到的wj反导入方程中，解得最终的目标函数

6.对样本进行分割时，用分割前的目标函数的值-分割后左右子树的目标函数的值，来划分得到最大的分割情况，以此来判断分割的界限

xgboost依据的是一种残差思想

以下是推导过程

实例说明

转载于:https://www.cnblogs.com/my-love-is-python/p/9786390.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_34144848

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

ML XGBoost详细原理及公式推导讲解+面试必考知识点

weixin_43646592的博客

11-21

686

ML XGBoost详细原理及公式推导讲解+面试必考知识点

白话机器学习算法理论+实战番外篇之Xgboost

Miracle8070

03-14

1万+

1. 写在前面如果想从事数据挖掘或者机器学习的工作，掌握常用的机器学习算法是非常有必要的，在这简单的先捋一捋，常见的机器学习算法：监督学习算法：逻辑回归，线性回归，决策树，朴素贝叶斯，K近邻，支持向量机，集成算法Adaboost等无监督算法：聚类，降维，关联规则, PageRank等我前面已经尝试用最白话的语言完成了一个白话机器学习算法理论+实战系列，这个系列已经基本包含了上面这些算...

参与评论您还未登录，请先登录后发表或查看评论

集成算法学习（1）-Bagging、Boosting(AdaBoost)原理与公式推导

我不爱机器学习的博客

12-30

3982

1、决策树与集成学习的关系根据python3 决策树（ID3、C4.5、CART）原理详细说明与公式推导可知：决策树容易解释，可以处理离散和连续值，对输入变量的单调转换不敏感（因为分割点是基于数据点的排序），执行自动变量选择，对异常值相对稳定，可以很好地扩展到大型数据集，并且可以修正输入的缺失值。但是决策树与其他类型的模型相比，预测不是很准确。这部分是由于树构造算法的贪心本性。一个相关...

机器学习集成算法XGBoost原理及推导

打牛地的博客

10-15

2647

XGBoosting介绍在上一篇构造决策树的博客中说到，XGBoost是一种通过集成的思想提高模型准确率的算法，这种算法是基于决策树模型的。不懂的可以看下面地址，包含了决策树的介绍和构造。 https://blog.youkuaiyun.com/weixin_43172660/article/details/82995442 下面通过一个具体的例子来说明XGBoost干了一件什么样的事情。如果要判断是否打...

adaboost算法_从0开始实现一个Adaboost分类器（完整代码）

weixin_39763293的博客

11-22

588

导读日前，通俗易懂的推导了三种集成学习的原理及主要公式，今天本文基于Python从0开始手动实现一个Adaboost分类器，文中提供完整代码。01 Adaboost基本原理回顾Adaboost作为一种提升集成算法，核心思想是不断训练弱学习器，来针对性的提升前一轮中预测错误样本的权重，最终通过加权所有弱学习器的训练结果得到最终分类标签。Adaboost是一种加权提升的集成算法，关键在于两个...

逻辑回归损失函数推导及求导

wj1298250240的博客

01-19

2320

sigmoid函数求导： https://blog.youkuaiyun.com/u012421852/article/details/79614417 通过logistic曲线就可以知道 1）sigmoid函数是一个阀值函数，不管x取什么值，对应的sigmoid函数值总是0<sigmoid(x)<1。 2）sigmoid函数严格单调递增，而且其反函数也单调递增 3）sigmoid函数连续 4）...

基础算法-Xgboost

weixin_41175904的博客

10-25

1945

0 前言 xgboost一直在竞赛江湖里被传为神器，比如时不时某个kaggle/天池比赛中，某人用xgboost于千军万马中斩获冠军。而我们的机器学习课程里也必讲xgboost，如寒所说：“RF和GBDT是工业界大爱的模型，Xgboost 是大杀器包裹，Kaggle各种Top排行榜曾一度呈现Xgboost一统江湖的局面，另外某次滴滴比赛第一名的改进也少不了Xgboost的功劳”。此外，公司七月在线从2016年上半年起，就开始组织学员参加各种比赛，以在实际竞赛项目中成长（毕竟，搞AI不可能没实战，而参

集成学习-Boosting集成学习算法XGBoost

数据掘金

10-28

2092

XGBoost全名叫（eXtreme Gradient Boosting）极端梯度提升，经常被用在一些项目中，其效果显著。它是大规模并行boosted tree的工具，它是目前最快最好的开源boosted tree工具包。XGBoost 所应用的算法就是GBDT（gradient boosting decision tree）的改进，既可以用于分类也可以用于回归问题中。全称：eXtreme Gradient Boosting（极值梯度提升算法）作者：陈天奇(华盛顿大学博士) 基...

20240330-2-XGBoost面试题

qq_24428851的博客

04-21

1307

XGBoostXGBoostXGBoost是大规模、分布式的通用梯度提升(GBDT)库，它在GB框架下实现了GBDT和一些广义线性ML算法。XGBoostXGBoostXGBoost是一种集成学习算法，属于3类常用的集成方法(BaggingBaggingBaggingBoostingBoostingBoostingStackingStackingStacking)中的Boosti。

机器学习 -- XGBoost算法学习笔记

qq_28873351的博客

09-17

567

文章目录前言1. 基本概念1.1 回归树与决策树1.2 CART回归树1.3 boosting集成学习1.4 回归树形成的关键点2. 集成思想3. 分析思路3.1 贪心算法3.1.1暴力枚举4. 原理推导5. 总结6. XGBoost参数前言目前风控算法较为流行的是传统机器学习，如：逻辑回归，xgboostxgboostxgboost，加业务理解挖掘高效特征，结合策略建立评分卡，反欺诈模型。之...

决策树（十二）--XGBoost

工作笔记

11-11

7429

转自：https://cloud.tencent.com/developer/article/1005611 个人感觉这篇文章还是跟网上很多文章一样，把xgboost按gbdt来解释来。我这里略删改。不对之处，还请指正～原始论文：https://arxiv.org/pdf/1603.02754v1.pdf 实际上，xgboost是对gbdt的优化，所以，先说gbdt. GBDT 是常用的机...

【原创】XGBoost分类器原理及应用实战

热门推荐

suvedo的博客

11-04

1万+

本文结合作者对xgboost原理的理解及使用xgboost做分类问题的经验，讲解xgboost在分类问题中的应用。内容主要包括xgboost原理简述、xgboost_classifer代码、xgboost使用心得和几个有深度的问题 XGBoost原理简述 xgboost并没有提出一种新的机器学习算法，而是基于现有的GBDT/lambdaMART等tree boosting算法在系统及算法层面（主要是系统层面）进行了改进；系统层面改进点包括：带权重的分位点分割算法(weighted quantile sket

《机器学习-原理、算法与应用》出版了

SIGAI_优快云的博客

11-07

7358

为什么要写本书？本书的前身为《机器学习与应用》，雷明著，清华大学出版社。在第一版的基础上做了大幅度优化，并经过反复校对，最终形成此书。由于之前是第一次写书，缺乏经验，导致了书的内容过多，里面存在大量开源库代码占据篇幅。这一版改进了这些问题，且增加了不少新的内容，更为系统和全面，品质也得到了不小的提升。 SIGAI微信公众号自去年4月份发布第一篇文章“机器学习-波澜壮阔40年”起，到今天为止，已...

阿里云Qwen3系列模型部署微调评测

wys的专栏

09-07

1049

让算力成为公共服务：用大规模的通用计算，帮助客户做从前不能做的事情，做从前做不到的规模。让数据成为生产资料：用数据的实时在线，帮助客户以数据为中心改变生产生活方式创造新的价值。

torch神经网络入门级设备测试

m0_71002812的博客

09-07

1586

本文介绍了一个基于PyTorch的CPU与GPU性能评估系统，用于比较不同硬件在求解常微分方程(ODE)的神经网络模型中的计算效率。系统包含以下核心功能：自动检测CUDA可用性及GPU配置构建多层前馈神经网络模型求解二阶ODE 性能基准测试：分别在CPU/GPU上运行相同训练任务，计算加速比内存使用分析：对比CPU/GPU张量的内存占用情况梯度计算专项测试：评估反向传播耗时差异评估结果显示，在处理大规模数据(≥5000个数据点)时，GPU凭借并行计算优势可获得显著加速效果。系统适用于科研人员优化物

AI驱动的软件测试：革命性的自动化、缺陷检测与实验优化

zzywxc787的博客

09-06

714

人工智能（AI）和机器学习（ML）技术的融入，正在从根本上重塑软件测试的格局，将其从一种主要是手动的、重复性的任务转变为一种智能的、预测性的、且持续优化的过程。*说明：多臂老虎机算法（MAB）由于将更多流量分配给了更好的版本B，其累积回报（点击次数）的增长速度远快于传统A/B测试（固定50/50分流）。：利用NLP技术（如文本分类）自动分析新提交的Bug报告的内容、标题和描述，将其自动分类（如“前端UI问题”、“后端API错误”），并推荐或分配给最合适的开发人员（基于谁修改了相关代码文件）。

[TKDE 2023] A Review on Deep Neural Networks for ICD Coding

Sherlily的博客

09-07

1709

计算机-人工智能-ICD编码机器学习深度学习综述

MOSS-TTSD: 文本对话式语音克隆

m0_72580657的博客

09-10

713

MOSS-TTSD是一款突破性的对话语音生成系统，专为提升人机交互体验而设计。基于Qwen3-1.7B-base模型优化，它支持中英双语，实现零样本音色克隆和长达960秒的连续语音生成。核心创新包括XY-Tokenizer（1kbps低比特率编码）和对话语境建模技术，经过110万小时语音数据训练。性能评估显示其词错误率低至1.90%，媲美顶尖模型。适用于播客、直播、教育等多种场景，提供本地部署方案。目前支持双人对话克隆，多人对话功能正在开发中。

大模型应用开发八股