机器学习_XGBoost

最新推荐文章于 2024-01-16 18:27:42 发布

Michael_Yen

最新推荐文章于 2024-01-16 18:27:42 发布

阅读量104

点赞数

文章标签：机器学习人工智能

本文链接：https://blog.youkuaiyun.com/weixin_41858806/article/details/132185199

版权

1.3 XGBoost

1.3.1 算法原理

主要优化了Gradient Boosting Decision Trees（GBDT）算法。XGBoost在性能和效率方面都进行了改进，使得它成为了一种更强大、更高效的集成学习算法。

1.3.2 算法步骤

1.3.2.1 模型初始化

初始化模型为一个常数值，通常为目标变量的平均值。

1.3.2.2 迭代训练

计算损失函数的梯度和海森矩阵，用于构建每棵树的损失函数。使用损失函数的近似剧烈下降方向来训练决策树。根据树的分数计算样本的权重，用于调整样本在下一轮迭代中的影响。将新训练的树添加到当前模型中，以更新模型的预测。

1.3.2.3 模型加权

最终的模型是所有决策树的加权融合，每个决策树的权重与其性能和贡献相关。

1.3.3 代码实现

import numpy as np
import pandas as pd
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from xgboost import XGBClassifier
from sklearn.metrics import accuracy_score

iris = load_iris()
X = iris.data
y = iris.target

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
model = XGBClassifier(n_estimators=100,
                      learning_rate=0.1,
                      max_depth=3)
model.fit(X_train, y_train)

y_pred = model.predict(X_test)
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)