第四章 平稳序列的拟合与预测
4.1 建模步骤
当我们拿到一组数据,想要通过这组数据来探究过去发生的规律,研究现在发生的强度并预测未来事情的发展走向,就需要从这些数据中挖掘出事物发生的特征,比如频率、强度、集中值等等,来提取“经验”,对过去的作出反应,弥补或者提取收益,而后建立一个合适的模型,来预测未来事物的发展,掌握未来动态,并及时调整,做好准备。
对于时间序列数据,当我们拿到数据时,我们首先要对数据进行预处理,事实上,所有的数据都是如此,经过预处理使之成为合适的,可以进行预测的,有用的数据。
时间序列数据的预处理是要进行平稳性检验,只有平稳的时间序列数据才是可以利用的,有效的数据,才能进行预测。还要进行纯随机检验,确保其是非白噪声序列。
4.2 模型识别
若数据是平稳的非白噪声序列,则可以考虑建模,但时间序列模型不止一种,具体要用哪种模型要根据数据的特征来判断,即先计算样本的ACF和PACF。根据样本的自相关系数和偏自相关系数的截尾和拖尾性来选择合适的模型拟合观察值序列。
定阶的基本原则如下:
ρ k ^ \hat{\rho_k} ρk^ | ϕ k k ^ \hat{\phi_{kk}} ϕkk^ | 模型定阶 |
---|---|---|
拖尾 | p阶截尾 | AR(p)模型 |
q阶截尾 | 拖尾 | MA(q)模型 |
拖尾 | 拖尾 | ARMA(p,q)模型 |
但是由于样本的随机性,样本的相关系数不会呈现出理论上的截尾的完美情况,应该截尾的样本自相关系数或偏自相关系数就会呈现出小值震荡。同时,又因为平稳时间序列通常具有的短期相关性,随着延迟阶数趋近于无穷, ρ k ^ \hat{\rho_k} ρk^与 ϕ k k ^ \hat{\phi_{kk}} ϕkk^都会衰减至零值附近作小值波动。
这就给我们留下了一个问题,判断拖尾的标准情况是什么?其实并没有,主要还是依靠分析人员的主观经验。根据诸多统计学家的证明,样本自相关系数是总体自相关系数的有偏估计,当k足够大时,根据平稳序列自相关系数呈负指数衰减,有 ρ k → 0 \rho_k\rightarrow0 ρk→0,而当样本容量n充分大时,样本的自相关系数和偏自相关系数都是近似于正态分布,根据正态分布的性质,可以利用2倍标准差范围辅助判断。
如果样本自相关系数或偏自相关系数在最初的d阶明显超过2倍标准差范围,而后几乎95%的自相关系数都落在2倍标准差的范围以内,而且由非零自相关系数衰减为小值波动的过程非常突然,这时,通常视为自相关系数截尾。截尾阶数为d。
如果有超过5%的样本自相关系数落入2倍标准差范围之外,或者由显著非零的自相关系数衰减为小值波动的过程非常连续或比较缓慢,这时,通常视为自相关系数不截尾。
4.3 参数估计
对于非中心化的ARMA(p,q)模型,有 x t = μ + Θ q ( B ) Φ q ( B ) ϵ t x_t=\mu+\frac{\Theta_q(B)}{\Phi_q(B)}\epsilon_t xt=μ+Φq(B)Θq(B)ϵt,式中 ϵ t ∼ W N ( 0 , σ ϵ 2 ) \epsilon_t\thicksim WN(0,\sigma^2_{\epsilon}) ϵt∼WN(0,σϵ2)【WN白噪声】。模型中共含有p+q+2个未知参数: θ 1 , θ 2 , ⋯ , θ q , ϕ 1 , ϕ 2 , ⋯ , ϕ p , μ , σ ϵ 2 \theta_1,\theta_2,\cdots,\theta_q,\phi_1,\phi_2,\cdots,\phi_p,\mu,\sigma_{\epsilon}^2 θ1,θ2,⋯,θq,ϕ1,ϕ2,⋯,ϕp,μ,σϵ2。
参数 μ \mu μ是序列均值,通常采用一阶中心距的估计方法,用样本均值估计总体均值即可得到它的估计值。
再将原序列中心化,则待估参数减少至p+q+1个。对这些参数有三种估计方法:距估计、极大似然估计、最小二乘估计。
4.3.1 距估计
用p+q个样本自相关系数估计总体自相关系数,构造p+q个方程组成的Yule-Walker方程组
{ ρ 1 ( ϕ 1 , ⋯ , ϕ p , θ 1 , ⋯ , θ q ) = ρ 1 ^ ⋮ ρ p + q ( ϕ 1 , ⋯ , ϕ p , θ 1 , ⋯ , θ q ) = ρ p + q ^ \begin{cases} \rho_1(\phi_1,\cdots,\phi_p,\theta_1,\cdots,\theta_q)=\hat{\rho_1}\\ \vdots\\ \rho_{p+q}(\phi_1,\cdots,\phi_p,\theta_1,\cdots,\theta_q)=\hat{\rho_{p+q}}\\ \end{cases} ⎩⎪⎪⎨⎪⎪⎧ρ1(ϕ1,⋯,ϕp,θ1,⋯,θq)=ρ1^⋮ρp+q(ϕ1,⋯,ϕp,θ1,⋯,θq