基于聚类 - XGB 的动态时间序列预测与交通数据缺失值处理
1. 预测指标与常用方法
在评估预测性能时,平均绝对百分比误差(MAPE)是最常用的指标之一。其计算公式为:
[M = \frac{1}{n}\sum_{t = 1}^{n}\frac{\vert A_t - F_t\vert}{A_t}]
其中 (A_t) 表示实际值,(F_t) 是预测值。
常用的网格搜索方法主要用于调整参数。其操作步骤如下:
1. 依次使用不同的参数对模型进行测试。
2. 通过穷举搜索超参数,对每种情况进行求解。
3. 从预先指定参数的所有情况中,选择性能最佳的一组参数。
2. XGBOOST 算法
XGBOOST 可简称为 XGB,由美国华盛顿大学的陈天奇博士开发。该算法的核心思想是通过不断添加树并持续分裂特征来构建模型。每次添加一棵树实际上是学习一个新的函数来拟合上一次预测的残差。
当完成训练得到 (k) 棵树后,对一个样本进行预测时,根据样本的特征,它会落在每棵树的相应叶子节点上,每个叶子节点对应一个分数,最后将每棵树对应的分数相加,即可得到样本的预测值,公式如下:
[\hat{y} = \Phi(x_i) = \sum_{k = 1}^{K}f_k(x_i)]
其中 (F = {f(x) = wq(x)}(q : R^m \to T, w \in R^T)) ,(wq(x)) 是叶子节点 (q) 的分数,(f(x)) 是回归树之一。
目标函数为:
[Obj = \sum_{i = 1}^{n}l(y_i, \hat{y} i) + \su
超级会员免费看
订阅专栏 解锁全文
68

被折叠的 条评论
为什么被折叠?



