时间序列预测方法选择与优化策略
1. 时间序列预测方法概述
在时间序列预测领域,没有一种方法能始终优于其他方法,不同的应用场景需要选择不同的预测方法。在无法进行客观的实证比较(如交叉验证)时,可依据以下主观标准来选择合适的方法。
1.1 数据可用性
多数机器学习(ML)方法通常至少需要数千个样本才能得到充分训练,而更复杂的模型(如深度神经网络,DNN)可能需要数百万个样本的数据集。如果可用数据集不满足这些要求,采用一些统计的局部方法会更合理。所选方法在可训练参数或规则方面的复杂度应与手头训练集的大小成正比。
1.2 横截面关系
如果数据集由多个横截面相关的序列组成(如不同商店的产品销售或不同地区的能源需求),选择全局的ML或深度学习(DL)模型是最有前景的方法,这样可以有效学习序列间的关系和总体趋势。即使数据集的序列并非直接相关,但具有一些关键共性(如相同的数据频率或来自同一领域),也能训练出准确的全局模型。不过,在这种情况下,交叉学习的预期收益可能较小,并且可能需要额外的数据处理来使各个样本更具同质性。
1.3 解释变量
一般来说,ML和DL方法在将解释变量纳入时间序列预测方面比统计模型提供了更高效的框架。但根据可用特征的类型和数量,不同的ML或DL方法可能更合适。例如,基于决策树的模型通常更擅长处理大量特征,特别是当部分解释变量与预测无关或为分类性质时;相反,神经网络(NN)通常在处理与目标变量呈非线性关系的连续解释变量时更有效。
1.4 预测不确定性
当预测的不确定性较大时,投资于复杂的ML或DL模型并不总是能带来更优的预测结果。例如,在预
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



