尼日利亚季节性非平稳气候数据的时间序列预测
1. 引言
气候数据的准确预测对于许多领域都至关重要,如农业、水资源管理和灾害预警等。本文将比较人工神经网络(ANN)技术与传统时间序列方法在预测尼日利亚气候数据方面的性能。
2. 方法
2.1 指数平滑模型
指数平滑模型用于处理涉及未观测变量或参数的动态时间序列问题,这些变量或参数描述了基础系统状态的演变。常见的指数平滑模型有以下几种:
-
单指数平滑(SES)
:适用于无趋势和季节性的单变量数据。需要一个参数 $\alpha$(平滑因子),控制先前时间步长观测值影响的指数衰减率。公式如下:
- $f_t = \alpha y_{t - 1} + (1 - \alpha)f_{t - 1}$
- 另一种形式:$f_{t + 1} = \alpha y_t + (1 - \alpha)f_t$
-
双指数平滑(Holt)
:是单指数平滑的扩展,明确支持单变量时间序列中的趋势。除了控制水平平滑因子的 $\alpha$ 参数外,还添加了一个平滑因子 $\beta$ 来控制趋势变化影响的衰减。方程如下:
- $f_t = \alpha y_t + (1 - \alpha)f_{t - 1} + T_{t - 1}$
- $T_t = \beta(f_t - f_{t - 1}) + (1 - \beta)T_{t - 1}$
- $\hat{f}
{t + 1} = f_t + T_t$
-
高级(三重)指数平滑(Holt - Winters 模型)
:是指数平滑的最先进变体,包含双指数和单指数平滑模型。除了 $\alpha$ 和 $\beta$ 平滑因子外,还添加了一个新参数 $\gamma$ 来控制季节性分量的影响。方程如下:
- $f_t = \alpha \frac{y_t}{T
{t - L}} + (1 - \alpha)(f_{t - 1} + b_{t - 1})$
- $b_t = \gamma(f_t - f_{t - 1}) + (1 - \gamma)b_{t - 1}$
- $T_t = \beta_t \frac{y_t}{f_t} + (1 - \beta)I_{t - L}$
2.2 人工神经网络模型
人工神经网络(ANN)因其独特的特征,成为预测天气时间序列的有前途的替代技术。在本研究中,通过
forecast
R 包的
nnetar
函数应用神经网络模型,生成具有单个隐藏层和滞后输入的前馈神经网络来预测单变量时间序列。
2.3 模型性能指标
使用均方根误差(RMSE)、平均绝对误差(MAE)、平均百分比误差(MPE)和平均绝对百分比误差(MAPE)作为评估模型拟合尼日利亚气候数据质量的标准,公式如下:
- $RMSE = \sqrt{\frac{1}{n} \sum_{t = 1}^{n} e_t^2}$
- $MAE = \frac{1}{n} \sum_{t = 1}^{n} |e_t|$
- $MPE = \frac{100\%}{n} \sum_{t = 1}^{n} \frac{e_t}{y_t}$
- $MAPE = \frac{100\%}{n} \sum_{t = 1}^{n} \left|\frac{e_t}{y_t}\right|$
其中,$e_t = y_t - \tilde{y}_t$,$y_t$ 是观测到的温度值,$\tilde{y}_t$ 是模型拟合值。
3. 结果与讨论
3.1 描述性统计
| 变量 | 均值 | 标准差 | 中位数 | 最小值 | 最大值 | 范围 | 偏度 | 峰度 |
|---|---|---|---|---|---|---|---|---|
| 温度 | 27.24 | 1.85 | 26.80 | 23.20 | 31.50 | 8.30 | 0.40 | -0.74 |
| 降雨量 | 96.66 | 86.28 | 81.30 | 0.20 | 271.60 | 271.40 | 0.38 | -1.37 |
根据偏度值,温度呈左偏态(负偏态),降雨量呈右偏态(正偏态)。Jarque - Bera 检验表明气候数据不服从正态分布。温度趋势随时间波动,1998 年缓慢上升,2013 年左右下降;降雨量趋势也随时间波动,1995 年突然增加,2012 年左右下降后又突然增加。
3.2 模型性能比较
-
温度数据
| 模型 | RMSE | MAE | MPE | MAPE |
| ---- | ---- | ---- | ---- | ---- |
| SES | 0.663 | 0.490 | -95963 | 110356 |
| Holt | 0.769 | 0.531 | -777.557 | 343.281 |
| Holt - Winters | 0.879 | 0.706 | 0.099 | 2.589 |
| ANN | 0.047 | 0.034 | -0.002 | 0.125 | -
降雨量数据
| 模型 | RMSE | MAE | MPE | MAPE |
| ---- | ---- | ---- | ---- | ---- |
| SES | 20.155 | 13.249 | 135.598 | 211.926 |
| Holt | 33.011 | 22.570 | -6485.084 | 6728.740 |
| Holt - Winters | 43.648 | 28.496 | -51.104 | 91.634 |
| ANN | 18.990 | 12.834 | -28.450 | 45.277 |
从上述表格可以看出,ANN 在预测温度和降雨量数据方面均表现最佳,具有最低的误差指标。
mermaid 流程图如下:
graph LR
A[数据收集] --> B[描述性统计分析]
B --> C[模型选择]
C --> D1[指数平滑模型]
C --> D2[人工神经网络模型]
D1 --> E[模型训练与预测]
D2 --> E
E --> F[模型性能评估]
F --> G[结果分析与讨论]
综上所述,在预测尼日利亚气候数据方面,人工神经网络模型的性能优于传统的指数平滑模型。ANN 能够更准确地捕捉气候数据中的非线性和季节性特征,为气候预测提供更可靠的结果。
尼日利亚季节性非平稳气候数据的时间序列预测
3.3 模型诊断
对 ANN 模型的诊断检查如图 5 和图 6 所示,进一步表明对于温度和降雨量拟合,随机误差具有相当稳定的方差,这与其他模型不同。因此,ANN 可用于预测温度和降雨量。
4. 讨论
本研究对比了深度学习技术与传统统计方法在预测 1991 - 2020 年尼日利亚每月气候数据方面的预测能力。通过比较分析得出,具有最低 MAE 和 RMSE 误差率的深度学习算法(如 ANN 类型的神经网络)可能比 Holt - Winters 指数平滑方法更适合用于气候的长期预测。
研究中考虑的模型包括多种指数平滑模型变体,并与使用随机梯度下降来估计自回归所施加动态的人工神经网络模型进行了比较。Mann Kendall 趋势分析显示,尼日利亚的温度和降雨量数据都存在季节性趋势。这一结果强调了尼日利亚的气候正在发生变化,特别是极端降雨事件的频率和强度增加,以及温度变异性也在经历重要变化。
本研究证实了神经网络方法更适合用于预测气候数据,可能是因为其他技术在预测非线性气候数据时存在许多缺点,如序列相关性和偏差。
5. 结论
本研究比较了人工神经网络技术与传统时间序列方法在预测尼日利亚气候数据方面的预测能力。结果表明,与 Holt - Winters 平滑模型相比,ANN 在预测尼日利亚气候数据方面更加准确和优越。此外,ANN 不需要传统时间序列模型所需的复杂假设。
Holt - Winters 方法可能不适用于尼日利亚气候事件的长期预测。因此,ANN 可能更适合处理具有非线性或未知分布的数据,如温度和降雨量,从而为尼日利亚及类似非洲地区的政策行动提供参考。
研究表明,人工神经网络模型在预测高频温度和降水数据方面始终表现更好。人工神经网络模型属于深度学习模型类别,已被证实能够充分捕捉和预测非线性、季节性气候数据。
在未来的工作中,将研究几种深度学习模型在不平衡聚类气候数据上的预测性能,并与人工神经网络模型进行比较。本研究的结果对于气候研究人员、规划者、从业者和政策制定者在选择最佳气候变量预测模型时具有参考价值。
以下是不同模型在温度和降雨量预测上的性能总结表格:
| 数据类型 | 模型 | RMSE | MAE | MPE | MAPE |
| ---- | ---- | ---- | ---- | ---- | ---- |
| 温度 | SES | 0.663 | 0.490 | -95963 | 110356 |
| 温度 | Holt | 0.769 | 0.531 | -777.557 | 343.281 |
| 温度 | Holt - Winters | 0.879 | 0.706 | 0.099 | 2.589 |
| 温度 | ANN | 0.047 | 0.034 | -0.002 | 0.125 |
| 降雨量 | SES | 20.155 | 13.249 | 135.598 | 211.926 |
| 降雨量 | Holt | 33.011 | 22.570 | -6485.084 | 6728.740 |
| 降雨量 | Holt - Winters | 43.648 | 28.496 | -51.104 | 91.634 |
| 降雨量 | ANN | 18.990 | 12.834 | -28.450 | 45.277 |
mermaid 流程图展示 ANN 应用于气候预测的优势:
graph LR
A[气候数据特点] --> B1[非线性]
A --> B2[季节性]
B1 --> C[传统模型局限]
B2 --> C
C --> D[ANN 优势]
D --> E[准确预测]
D --> F[稳定误差]
E --> G[为政策提供参考]
F --> G
综上所述,ANN 在尼日利亚气候数据预测中展现出明显优势,未来在气候预测领域有望发挥更大作用。
超级会员免费看
113

被折叠的 条评论
为什么被折叠?



