时间序列预测:目标特征生成、特征提取与预测筛选
1. 目标特征的时间序列生成
在时间序列分析中,研究人员可能仅关注特征空间的特定区域或部分特征。例如,金融时间序列中的异方差性和波动性、微观经济时间序列中的趋势和熵,或能源时间序列中的峰值和尖峰。从业者也可能希望从有限的真实数据集中模拟更多时间序列,如新产品的销售记录和罕见疾病的健康指标。因此,有效生成具有目标特征的时间序列是一个关键问题。
不同学者提出了多种生成方法:
- Kang 等人(2017)使用遗传算法(GA)生成新的时间序列,以填补二维实例空间中的任何空白。
- Kegel 等人(2017)应用 STL 方法估计时间序列的趋势和季节性成分,并使用乘法因子进行修改以生成新的时间序列。
- Talagala 等人(2023)通过模拟与观察到的时间序列相似的新序列来扩充数据集,用于训练模型选择分类器,模拟序列依赖于指数平滑模型和 ARIMA 模型等假设的数据生成过程(DGPs)。
- Kang 等人(2020)使用 GA 调整 MAR 模型参数,直到目标特征向量与从 MAR 模拟的时间序列样本的特征向量之间的距离接近零。他们还开发了 R 包 gratis,可从 CRAN 获取,该包为生成具有多样且可控特征的时间序列提供了有效算法。
2. 特征提取
特征可以是从时间序列计算出的任何函数,如简单均值、拟合模型的参数或用于突出数据属性的统计量。然而,不存在时间序列的唯一“最佳”特征表示,所使用的特征取决于被分析时间序列的性质和分析目的。
例如,以均值作为简单的时间序列特征,如果某些时间序列包含单位根,那么在没有对时间序列初始值进行额外约束的情况下,均
超级会员免费看
订阅专栏 解锁全文
5862

被折叠的 条评论
为什么被折叠?



