机器学习分类模型的构建与评估
在机器学习领域,分类模型的构建和评估是非常重要的环节。本文将介绍一些常见的分类模型,如梯度提升机,以及如何评估这些模型的性能。
1. 梯度提升机(Gradient Boosting Machines)
梯度提升机(GBMs)可用于回归和分类任务。它以向前逐步的顺序方式构建加法模型,允许对任意可微损失函数进行优化。通常,GBMs 可以处理各种模型(弱学习器)和损失函数的组合。
Scikit - Learn 中使用的梯度提升回归树(GBRTs)是一种广义的提升模型,可应用于任意可微损失函数。GBRT 的加法模型数学表示如下:
[F(x)=\sum_{m = 1}^{M}\gamma_mh_m(x)]
其中 (h_m(x)) 是基础模型或弱学习器,这里是决策树。GBRT 以向前逐步的顺序方式构建加法模型,数学表示为:
[F_m(x)=F_{m - 1}(x)+\gamma_mh_m(x)]
在每个阶段,选择下一个决策树 (h_m(x)) 以最小化给定前一个决策树模型 (F_{m - 1}) 及其拟合 (F_{m - 1}(x_i)) 时的损失函数 (L),表示为:
[F_m(x)=F_{m - 1}(x)+\arg\min_{h}\sum_{i = 1}^{n}L(y_i,F_{m - 1}(x_i)+h(x_i))]
通常,决策树用作基础模型,最终目的是最小化残差(回归树)或负对数似然(分类树)。
2. 分类模型评估
训练、调整和构建模型是整个分析生命周期的重要部分,但了解这些模型的性能更为重要。分类模型的性能通常基于其对新数据点结果的预测能力。一般通
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



