ARIMA模型详解
- 基本概念
- ARIMA(p, d, q)预测模型
ARIMA差分整合移动平均自回归模型,用于时间序列数据分析与预测,相比ARMA模型在AR和MA之间多了差分步骤,目的是把非平稳序列转化为平稳序列,然后将因变量仅对它的滞后值以及随机误差项的现值和滞后值进行回归所建立的模型。其中p为偏相关图截尾的滞后阶数,是自回归AR的项数;d为平稳序列转非平稳序列所需的差分次数;q为预测误差的滞后值,即自相关图截尾的滞后阶数,是移动平均MA的项数,目的是使序列更光滑。
注:ARIMA模型要求时间序列数据满足平稳性和非白噪声(自相关系数接近0)。
差分可以提取非平稳确定性信息,但每次差分都会损失部分信息。
1.1 平稳序列的相关概念与检验
(1)平稳序列:序列的方差和均值为与时间无关的常数,协方差Cov(xt, xt-s)只与间隔s有关,
与t无关。(白噪声序列是平稳时间序列的一特例,要求均值与协方差为0)
(2) 非平稳序列:具有单位根,随着时间推进,数据无法回归给定值的趋势。
(3)单位根:序列的某个值等于前一个时期的对应值加上一个与之弱相关的干扰项。如果存在单位根,则可以通过差分来消除单位根,得到平稳序列。存在单位根的序列会表现出明显的记忆性和波动的持续性。
(4)平稳性转换的方法(由非平稳转换到平稳序列,实际具有三个方法)
①对数变换:减小数据振动幅度,使之线性规律更明显,相当于增加了处罚机制,数据越大惩罚越大。其中要求数据大于0。
②平滑法:移动平均法和指数平均法。
移动平均:利用一定时间间隔内的平均值作为某一期的估计值。
指数平均:不舍弃过去的数据,但仅给予逐渐减弱的影响程度/权值,即随着数据的远离,赋予逐渐收敛为零的权值。
③差分法(剔除周期性因素)
(5)平稳性检验:观察法和单位根检验法
①观察法:通过观察序列的趋势图与相关图是否随时间的变化呈现某种周期性的规律。线性周期可以用差分或者移动平均来解决,非线性周期需要一些分解方法。其中平稳序列的自相关系数会快速衰减。
②单位根检验:即检验该差分方程(时间序列数据的方程)的特征方程的各个特征根是否小于1(即是否在单位圆内)。特征根小于1时才能满足方程特解收敛,从而满足稳定性条件。如果大于1,某一期的微小波动在未来会变得无穷大(方差会变得非常大),数据则无法预测。该检验可以使用ADF法(还有KPSS检验、PP检验),原假设为序列具有单