本文从互联网搬运,只用于本人学习记录。
决策树之XGBoost
XGBoost使大规模并行boosting tree的工具。
1. 数学原理
1.1. 目标函数
XGBoost使由 k k k个基模型组成的一个加法运算式:
y i ^ = ∑ t = 1 k f t ( x i ) \hat{y_i} = \sum^k_{t = 1}f_t(x_i) yi^=t=1∑kft(xi)
其中 f k f_k fk为第 k k k个基模型, y i ^ \hat{y_i} yi^为第 i i i个样本的预测值。
损失函数由预测值 y i ^ \hat{y_i} yi^与真实值 y i y_i yi进行表示:
L = ∑ i = 1 n l ( y i , y i ^ ) L = \sum^n_{i = 1}l(y_i, \hat{y_i}) L=i=1∑nl(yi,yi^)
其中 n n n为样本数量。
目标函数由模型的损失函数 L L