36、基于聚类 - XGB 的动态时间序列预测与交通数据缺失值处理

基于聚类 - XGB 的动态时间序列预测与交通数据缺失值处理

1. 预测指标与常用方法

在评估预测性能时,平均绝对百分比误差(MAPE)是最常用的指标之一。其计算公式为:
[M = \frac{1}{n}\sum_{t = 1}^{n}\frac{\vert A_t - F_t\vert}{A_t}]
其中 (A_t) 表示实际值,(F_t) 是预测值。

常用的网格搜索方法主要用于调整参数。其操作步骤如下:
1. 依次使用不同的参数对模型进行测试。
2. 通过穷举搜索超参数,对每种情况进行求解。
3. 从预先指定参数的所有情况中,选择性能最佳的一组参数。

2. XGBOOST 算法

XGBOOST 可简称为 XGB,由美国华盛顿大学的陈天奇博士开发。该算法的核心思想是通过不断添加树并持续分裂特征来构建模型。每次添加一棵树实际上是学习一个新的函数来拟合上一次预测的残差。

当完成训练得到 (k) 棵树后,对一个样本进行预测时,根据样本的特征,它会落在每棵树的相应叶子节点上,每个叶子节点对应一个分数,最后将每棵树对应的分数相加,即可得到样本的预测值,公式如下:
[\hat{y} = \Phi(x_i) = \sum_{k = 1}^{K}f_k(x_i)]
其中 (F = {f(x) = wq(x)}(q : R^m \to T, w \in R^T)) ,(wq(x)) 是叶子节点 (q) 的分数,(f(x)) 是回归树之一。

目标函数为:
[Obj = \sum_{i = 1}^{n}l(y_i, \hat{y} i) + \su

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值