【时间序列分析基础系列之一】随机性时间序列模型

本文介绍了时间序列分析的基本概念,包括随机过程、平稳性、可逆性等,并详细阐述了ARMA模型的特性及其参数估计方法。


前言

1 随机性时间序列模型

时间序列分析方法是通过对样本观测值的观察分析,将时间序列的趋势项、周期项和随机项分解出来。
其中,对于趋势性或周期性变化,常用确定性时序分析,而对于余下的随机项,可用随机时序模型拟合,属于随机时序分析。确定和随机两部分组合起来共同描述一个时间序列。
随机性时间序列模型最早由G.E.P.Box和G.M.Jenkins提出。

1.1 基本概念

1.1.1 随机过程概念

T T T是负无穷到正无穷的子集,如果 ∀ t ∈ T \forall t\in T tT,都有一个随机变量与之对应,就称为随机变量的集合为随机过程。
T T T是全体整数或全体非负整数时,称相应的随机过程为离散随机过程。把随机序列的指标集合 T T T看成时间指标时,这个随机序列就是离散时间序列。
T T T是全体实数或全体非负实数时,称相应的随机过程为连续随机过程。把随机序列的指标集合 T T T看成时间指标时,这个随机序列就是连续时间序列。

1.1.2 几个重要的平稳随机过程

白噪声(纯随机过程)

a t {a_t} at为平稳序列,对于 ∀ t ∈ N \forall t\in N tN,都有

E ( a t ) = μ E(a_t)=\mu E(at)=μ
C O V ( a t , a s ) = {   σ a 2 , ( t = s )   0 , t ≠ s COV(a_t,a_s) = \left\{ \begin{aligned} \ \sigma^2_a, (t=s) \\ \ 0, t\neq s \end{aligned} \right. COV(at,as)={ σa2,(t=s) 0,t=s

独立增量随机过程

对于 ∀ n , t i ∈ T ( i = 1 , 2 , . . . , n ; t 1 < t 2 < . . . < t n ) \forall n,t_i \in T(i=1,2,...,n; t_1<t_2<...<t_n) n,tiT(i=1,2,...,n;t1<t2<...<tn),随机变量 X ( t 2 ) − X ( t 1 ) , X ( t 3 ) − X ( t 2 ) , . . . , X ( t n ) − X ( t n − 1 ) X(t_2)-X(t_1), X(t_3)-X(t_2),...,X(t_n)-X(t_n-1) X(t2)X(t1),X(t3)X(t2),...,X(tn)X(tn1)都相互独立,则称随机过程 { X t } = { X t : t ∈ T } \{X_t\}=\{X_t:t\in T\} {Xt}={Xt:tT}为独立增量随机过程

二阶矩过程与宽平稳过程

对于 ∀ t ∈ T , X t \forall t \in T,X_t tTXt的均值和方差存在,则称此过程为二阶矩过程。
若随机过程 { X t , t ∈ T } \{X_t, t \in T\} {Xt,tT}是一个二阶矩过程,且满足:
E X t = μ , ∀ t ∈ T   E [ X t + τ ] [ X t − μ ] = γ τ , ∀ t , t + τ ∈ T EX_t=\mu, \forall t\in T \\ \ \\ E[X_{t+\tau}][X_t-\mu]=\gamma_\tau, \forall t,t+\tau \in T EXt=μ,tT E[Xt+τ][Xtμ]=γτ,t,t+τT
则称 { X t , t ∈ T } \{X_t,t\in T \} {Xt,tT}为宽平稳随机过程。

注意:白噪声为宽平稳随机过程,平稳时间序列中讨论的都为宽平稳随机序列。

严平稳随机过程

对于 ∀ t i ( i = 1 , 2 , . . . , n ) \forall t_i(i=1,2,...,n) ti(i=1,2,...,n)和任意实数 s s s,随机过程 { X t } \{X_t\} {Xt} n n n维分布函数满足关系式,即为严平稳随机过程:
F n ( X 1 , X 2 , . . . , X n ; t 1 , t 2 , . . . , t n ) = F n ( X 1 , X 2 , . . . , X n ; t 1 + s , t 2 + s , . . . , t n + s ) F_n(X_1,X_2,...,X_n;t_1,t_2,...,t_n)=F_n(X_1,X_2,...,X_n;t_1+s,t_2+s,...,t_n+s) Fn(X1,X2,...,Xn;t1,t2,...,tn)=Fn(X1,X2,...,Xn;t1+s,t2+s,...,tn+s)
二阶矩存在的严平稳随机过程一定是宽平稳随机过程,反之不成立。

正态过程

{ X t , t ∈ T } \{X_t, t\in T\} {Xt,tT}的有限维分布都是正态分布,则称 { X t , t ∈ T } \{X_t, t \in T\} {Xt,tT}为正态随机过程。

1.1.3 动态性

动态性:系统现在的行为与其历史行为的相关性,也就是系统的记忆性,具体地,就是在某一时刻进入系统的输入对系统后续行为的影响,如果该输入只影响系统下一时刻的行为,而对下一时刻以后的行为不发生作用,那么系统就有一阶动态或一期记忆性。
那么以此类推,如果该输入对系统之后的 n n n个时刻的行为都有影响,那么就说系统具有 n n n阶动态性。例如, n n n阶自回归模型( A R ( n ) AR(n) AR(n))为:
X t = ϕ 1 X t − 1 + ϕ 2 X t − 2 + . . . + ϕ n X t − n + a t X_t = \phi_1 X_{t-1}+\phi_2 X_{t-2}+...+\phi_n X_{t-n}+a_t Xt=ϕ1Xt1+ϕ2Xt2+...+ϕnXtn+at
基本假设:Xt仅与X_{t-1}、X_{t-2}、X_{t-3}等有线性关系,a_{t}为独立同分布的正态序列
一种有意思的理解:n阶自回归模型就是将Xt中依赖于X_{t-1}、X_{t-2}、X_{t-3}等与过去相关的成分剥离掉,得到一个独立的时间序列a_{t}
而a_{t}作为白噪声序列,对过去没有记忆性
A R ( n ) AR(n) AR(n)模型对比来看, M A ( m ) MA(m) MA(m)模型描述的是系统对过去时刻进入系统的噪声的记忆:
X t = a t − θ 1 a t − 1 − θ 2 a t − 2 − . . . − θ m a t − m X_t = a_t-\theta_1 a_{t-1}-\theta_2 a_{t-2}-...-\theta_m a_{t-m} Xt=atθ1at1θ2at2...θmatm
基本假设:Xt仅与a_{t-1}、a_{t-2}、a_{t-3}等有线性关系,a_{t}为独立同分布的正态序列
该系统在t时刻的响应Xt与过去时刻的响应X_{t-1}、X_{t-2}、X_{t-3}等无关,而与过去t-1、t-2等时刻进入系统的扰动a_{t-1}、a_{t-2}、a_{t-3}存在着一定的相关关系,于是去掉这种相关关系以后,得到一个独立序列a_{t}
综合来看, A R M A ( n , m ) ARMA(n,m) ARMA(n,m)描述的是系统对过去自身状态以及各时刻进入的噪声的记忆。
X t − ϕ 1 X t − 1 − ϕ 2 X t − 2 − . . . − ϕ n X t − n = a t − θ 1 a t − 1 − θ 2 a t − 2 − . . . − θ m a t − m X_t-\phi_1 X_{t-1}-\phi_2 X_{t-2}-...-\phi_n X_{t-n} \\=a_t-\theta_1 a_{t-1}-\theta_2 a_{t-2}-...-\theta_m a_{t-m} Xtϕ1Xt1ϕ2Xt2...ϕnXtn=atθ1at1θ2at2...θmatm
注意:
(1) AR(n)、MA(n)、ARMA(n,m)模型都是ARMA(n,n-1)的特殊情形
(2) 对于平稳系统,都可以用一个ARMA(n,n-1)模型近似得到想要得到的任意程度
(3) 对于n阶自回归部分,移动平均部分的阶数应当为n-1
而对于一般ARMA(n,m)模型中m!=n-1的情形,实际上是ARMA(n,n-1)模型的\phi或\theta为0的特殊情形
从连续系统的离散化过程来看,ARMA(n,n-1)模型也是合理的

2 算子

2.1 差分算子

A R ( 1 ) AR(1) AR(1)模型为例:
X t = X t − 1 + a t X_t = X_{t-1}+a_t Xt=Xt1+at
即随机游走模型,该系统对过去有很强的惯性,与过去强相关,当Xt从t时刻移至t-1时刻时,若没有随机项a_{t},则Xt的值保持不变(完全的记忆性),但是就是因为这个a_{t},Xt的值才不确定。由于随机项a_{t}主宰X的增量大小,所以才称为随机游走模型
即有下式,其中 ∇ \nabla 表示差分算子:
∇ X t = a t \nabla X_t = a_t Xt=at
除此之外,我们称 Y t = X t − X t − 1 Y_t=X_t - X_{t-1} Yt=XtXt1叫做关于 X t X_t Xt的一阶差分,记为:
Y t = ∇ X t Y_t = \nabla X_t Yt=Xt
由此递归,则称 Z t = Y t − Y t − 1 Z_t=Y_t - Y_{t-1} Zt=YtYt1叫做关于 Y t Y_t Yt的一阶差分,也是关于 X t X_t Xt的二阶差分,记为:
Z t = ∇ Y t = X t − X t − 1 − X t − 1 + X t − 2 = ∇ 2 X t Z_t = \nabla Y_t=X_t - X_{t-1}-X_{t-1} + X_{t-2}=\nabla^2X_t Zt=Yt=XtXt1Xt1+Xt2=2Xt
类似地,设 X t X_t Xt地第 k − 1 k-1 k1次差分为 W t W_t Wt,则称 W t − W t − 1 W_t-W_{t-1} WtWt1 X t X_t Xt k k k阶差分。

注意:k阶差分不是简单的$X_t - X_{t-k}$,而是叠加差分。

2.2 格林函数

同样以 A R ( 1 ) AR(1) AR(1)模型为例:
X t = X t − 1 + a t X_t = X_{t-1}+a_t Xt=Xt1+at
对应的齐次差分方程的通解为:
X t = c φ 1 t , t ∈ Z X_t = c\varphi_1^t, t\in Z Xt=cφ1t,tZ
A R ( 1 ) AR(1) AR(1)右边的形式可知,模型的特解可能是 { a t } \{a_t\} {at}序列的线性组合:

X t = φ 1 X t − 1 + a t = φ 1 ( φ 2 X t − 2 + a t − 1 ) + a t = φ 1 2 X t − 2 + φ 1 a t − 1 + a t = φ 1 2 ( φ X t − 3 + a t − 2 ) + φ 1 a t − 1 + a t = φ 3 X t − 3 + φ 2 a t − 2 + φ 1 a t − 1 + a t . . . = ∑ j = 0 ∞ φ 1 j a t − j \begin{aligned} X_t &= \varphi_1X_{t-1}+a_t \\ &= \varphi_1(\varphi_2X_{t-2}+a_{t-1})+a_t \\ &=\varphi_1^2X_{t-2}+\varphi_1a_{t-1}+a_t \\ &=\varphi_1^2(\varphi X_{t-3}+a_{t-2})+\varphi_1a_{t-1}+a_t \\ &=\varphi^3X_{t-3}+\varphi^2a_{t-2}+\varphi_1a_{t-1}+a_{t} \\ &... \\ &=\sum^{\infty}_{j=0}\varphi_1^{j}a_{t-j} \end{aligned} Xt=φ1Xt1+at=φ1(φ2Xt2+at1)+at=φ12Xt2+φ1at1+at=φ12(φXt3+at2)+φ1at1+at=φ3Xt3+φ2at2+φ1at1+at...=j=0φ1jatj
A R ( 1 ) AR(1) AR(1)的通解为:
X t = ∑ j = 0 ∞ φ 1 j a t − j + c φ 1 t X_t=\sum^{\infty}_{j=0}\varphi_1^{j}a_{t-j}+c\varphi_1^t Xt=j=0φ1jatj+cφ1t
当|\varphi_{t}|<1时,t趋近于正无穷,则c\varphi_1^{t}趋近于0,则Xt完全被特解部分决定,也就是独立序列a_{t-j}部分确定
若|\varphi_{t}|>1时,则通解部分与特解部分均发散,这样的话就没有接下来的统计学意义了
(个人理解:第一,统计学预测意义角度,之后是将时间序列用于预测,如果发散,则并没有找到时间序列中的统计学规律,那么这样预测也是无意义的,故需要施加一个平稳性条件,之后的所有时间序列分析也是建立在平稳性假设条件基础上的预测;第二,遍历性角度。由于之后许多处理需要对不同t时刻进行期望方差计算,如果不同时刻的期望不同那么就非常麻烦了,就需要整个序列先平稳,也就是收敛到同一期望值,那么就方便了遍历计算)
而其中系数函数 φ 1 j \varphi_1^j φ1j客观地描述了该系数地动态性,故称此系数为格林函数,用 G j G_j Gj表示:
G j = φ 1 j G_j = \varphi_1^j Gj=φ1j
A R ( 1 ) AR(1) AR(1)的特解也可以改写为:
X t = ∑ j = 0 ∞ G j a t − j X_t=\sum^{\infty}_{j=0}G_ja_{t-j} Xt=j=0Gjatj
或:
X t = ∑ k = − ∞ t G t − k a k X_t=\sum^{t}_{k=-\infty}G_{t-k}a_{k} Xt=k=tGtkak

2.3 后移算子

后移算子 B B B表示后移的期数,如: B j X t = X t − j B^jX_t=X_{t-j} BjXt=Xtj
具有如下性质:

  • 对和 t t t无关的随机变量 Y Y Y有: B Y = Y BY=Y BY=Y
  • 对整数 n n n,常数 a a a有: B n ( a X t ) = a B n X t = a X t − n B^n(aX_t)=aB^nX_t=aX_{t-n} Bn(aXt)=aBnXt=aXtn
  • 对整数 n , m n,m n,m有: B n + m ( X t ) = B n B m X t = X t − n − m B^{n+m}(X_t)=B^nB^mX_t=X_{t-n-m} Bn+m(Xt)=BnBmXt=Xtnm
  • 对多项式 ψ ( z ) = ∑ j = 0 p c j z j \psi(z)=\sum^p_{j=0}c_jz^j ψ(z)=j=0pcjzj,有: ψ ( B ) X t = ∑ j = 0 p c j X t − j \psi(B)X_t=\sum^p_{j=0}c_jX_{t-j} ψ(B)Xt=j=0pcjXtj
  • 对多项式 ψ ( z ) = ∑ j = 0 p c j z j \psi(z)=\sum^p_{j=0}c_jz^j ψ(z)=j=0pcjzj φ ( z ) = ∑ j = 0 q d j z j \varphi(z)=\sum^q_{j=0}d_jz^j φ(z)=j=0qdjzj的乘积 f ( z ) = ψ ( z ) φ ( z ) f(z)=\psi(z)\varphi(z) f(z)=ψ(z)φ(z),有:
    f ( B ) X t = ψ ( B ) [ φ ( B ) X t ] = φ ( B ) [ ψ ( B ) X t ] f(B)X_t=\psi(B)[\varphi(B)X_t]=\varphi(B)[\psi(B)X_t] f(B)Xt=ψ(B)[φ(B)Xt]=φ(B)[ψ(B)Xt]
  • 对时间序列 X t , Y t X_t,Y_t Xt,Yt而言,多项式 ψ ( z ) = ∑ j = 0 p c j z j \psi(z)=\sum^p_{j=0}c_jz^j ψ(z)=j=0pcjzj和随机变量U,V,W,有: ψ ( B ) ( U X t + V Y t + W ) = U ψ ( B ) X t + V ψ ( B ) Y t + W ψ ( 1 ) \psi(B)(UX_t+VY_t+W)=U\psi(B)X_t+V\psi(B)Y_t+W\psi(1) ψ(B)(UXt+VYt+W)=Uψ(B)Xt+Vψ(B)Yt+Wψ(1)

2.4 逆函数

在一定条件下,所有模型也可以转化为无限阶的AR模型,即:
X t = I 1 X t − 1 + I 2 X t − 2 + . . . + a t = ∑ j = 1 ∞ I j X t − j + a t \begin{aligned} X_t &= I_1X_{t -1}+I_2X_{t -2} + ... + a_t \\ & = \sum_{j=1}^\infty I_jX_{t-j} + a_t \end{aligned} Xt=I1Xt1+I2Xt2+...+at=j=1IjXtj+at
或:
a t = ( 1 − ∑ j = 1 ∞ I j X t − j ) X t = ( 1 − I 1 B − I 2 B 2 − . . . ) X t = ∑ j = 0 ∞ ( − I j ) B j X t , ( I 0 = − 1 ) \begin{aligned} a_t &= (1-\sum_{j=1}^\infty I_jX_{t-j}) X_t\\ & = (1-I_1B-I_2B^2-...)X_t \\ & = \sum_{j=0}^\infty (-I_j)B^{j} X_t \end{aligned}, (I_0 = -1) at=(1j=1IjXtj)Xt=(1I1BI2B2...)Xt=j=0(Ij)BjXt,(I0=1)
上式被称为 X t X_t Xt的逆转形式,其中 I j I_j Ij称为逆函数。一个过程是否具有逆转形式,称为过程是否具有可逆性,或是否可逆。

2.5 格林函数与逆函数的对偶转换

利用对偶性求得一种模型的格林函数或逆函数,就可以直接得到与其对偶的模型的逆函数或格林函数。
具体做法为,在ARMA(n,m)的格林函数中用 − I j -I_j Ij代替 G j G_j Gj φ \varphi φ θ \theta θ相互代替:
例如,ARMA(1,2)的格林函数为:
{ G 1 = φ 1 − θ 1 G 2 = φ 1 G 1 − θ 2 G j = φ 1 G j − 1 , ( j ≥ 3 ) \begin{cases} G_1 = \varphi_1-\theta_1\\ G_2 = \varphi_1G_1 - \theta_2 \\ G_j = \varphi_1G_{j-1}, (j\geq3) \end{cases} G1=φ1θ1G2=φ1G1θ2Gj=φ1Gj1,(j3)
ARMA(2,1)的逆函数为:
{ I 1 = φ 1 − θ 1 I 2 = φ 2 − I 1 θ 1 I j = θ 1 I j − 1 , ( j ≥ 3 ) \begin{cases} I_1 = \varphi_1-\theta_1\\ I_2 = \varphi_2 - I_1\theta_1 \\ I_j = \theta_1I_{j-1}, (j\geq3) \end{cases} I1=φ1θ1I2=φ2I1θ1Ij=θ1Ij1,(j3)

3 平稳性与可逆性

对于ARMA模型来说,只有平稳且可逆才是有意义的,一般总是假定模型既平稳又可逆。

3.1 平稳性条件

对于ARMA(n,n-1)模型平稳性条件的参数形式,一般是先求得模型格林函数的显性表达式,然后看 x t x_t xt收敛时,特征根 λ 1 , λ 2 , . . . , λ n \lambda_1,\lambda_2,...,\lambda_n λ1,λ2,...,λn需要达到的要求是什么,特征根 λ n \lambda_n λn与参数 φ n \varphi_n φn关系转换后,即为是由参数 φ 1 , φ 2 , . . . , φ n , \varphi_1,\varphi_2,...,\varphi_n, φ1,φ2,...,φn,构成的n+1个不等式。
平稳性仅与自回归参数有关,而与移动平均参数无关。

3.1.1 ARMA(1,m)

平稳性条件:
∣ φ 1 ∣ < 1 |\varphi_1|<1 φ1<1

3.1.2 ARMA(2,m)

平稳性条件:
{ φ 1 + φ 2 < 1 φ 2 − φ 1 < 1 ∣ φ 2 ∣ < 1 \begin{cases} \varphi_1+\varphi_2<1\\ \varphi_2 - \varphi_1 <1 \\ |\varphi_2|<1 \end{cases} φ1+φ2<1φ2φ1<1φ2<1

3.2 可逆性条件

可逆性与移动平均参数有关,而与自回归参数无关。

3.2.1 ARMA(n,1)

平稳性条件:
∣ θ 1 ∣ < 1 |\theta_1|<1 θ1<1

3.2.2 ARMA(n,2)

平稳性条件:
{ θ 1 + θ 2 < 1 θ 2 − θ 1 < 1 ∣ θ 2 ∣ < 1 \begin{cases} \theta_1+\theta_2<1\\ \theta_2 - \theta_1 <1 \\ |\theta_2|<1 \end{cases} θ1+θ2<1θ2θ1<1θ2<1

4 分解

4.1 Wold分解

回顾 A R ( 1 ) AR(1) AR(1)模型的特解为下式,下式也被成为Wold分解式, G j G_j Gj也叫Wold系数:
X t = ∑ j = 0 ∞ = G j a t − j X_t = \sum^\infty_{j=0} =G_ja_{t-j} Xt=j=0=Gjatj
由于 a t − j a_{t-j} atj为相互独立的(模型假设),所以可以看作线性空间的基, X t X_t Xt可由 a t − j a_{t-j} atj进行线性表示。其系数 G j G_j Gj X t X_t Xt对于 a t − j a_{t-j} atj的坐标投影, X t X_t Xt G j a t − j G_ja_{t-j} Gjatj的正交向量和。
也就是说,用线性空间来审视上式,即为wold分解。

5 模型识别

5.1 Box-Jenkins法

即根据样本自相关、偏自相关函数的截尾性和拖尾性初步判断序列所适合的模型类型。

  1. 零均值化
  2. 样本自相关函数
    ρ k ^ = ∑ t = 1 n − k ( x t − x ˉ ) ( x t − k − x ˉ ) ∑ t = 1 n ( x t − x ˉ ) 2 \hat{\rho_k} = {\sum_{t=1}^{n-k}(x_t-\bar{x}) (x_{t-k}-\bar{x})\over \sum_{t=1}^{n}(x_t-\bar{x})^2} ρk^=t=1n(xtxˉ)2t=1nk(xtxˉ)(xtkxˉ)
  3. 样本偏自相关函数
    ϕ k k ^ = D k ^ D ^ \hat{\phi_{kk}} = {\hat{D_k } \over \hat D} ϕkk^=D^Dk^
  4. 根据截尾和拖尾判断模型
自相关函数偏自相关函数选择模型
拖尾p阶截尾AR(p)
q阶截尾拖尾MA(q)
拖尾拖尾ARMA(p,q)
# 6 参数估计 ## 6.1 直接估计法 常用的参数估计方法:

6.1.1 矩估计

6.1.2 极大似然估计

6.1.3 条件最小二乘估计

条件最小二乘估计是实际中最常用的参数估计方法,假设条件为:
a t − 1 = a t − 2 = . . . = a t − q = 0 a_{t-1}=a_{t-2}=...=a_{t-q}=0 at1=at2=...=atq=0
残差平方和方程为:
Q ( β ^ ) = ∑ t = p + 1 n a t 2 = ∑ t = p + 1 n [ X t − ∑ i = 1 p φ i X t − i + ∑ j = 1 q θ j a t − j ] 2 Q(\hat\beta)=\sum^n_{t=p+1}a_t^2=\sum^n_{t=p+1}[X_t-\sum^p_{i=1}\varphi_iX_{t-i}+\sum^q_{j=1}\theta_ja_{t-j}]^2 Q(β^)=t=p+1nat2=t=p+1n[Xti=1pφiXti+j=1qθjatj]2
解法:迭代法
优缺点:

  • OLS估计充分应用每一个观察值提供的信息,因而估计精度高
  • 条件OLS估计使用率较高
  • 但是需要假定总体分布(缺点)

6.2 数值法

都是用迭代

6.2.1 线性迭代法

给出初始值,根据式子进行迭代计算,直至相邻两次迭代值相差不大时停止迭代,最后迭代结果作为近似解

6.2.2 牛顿-拉普森(Newton-Raphson)算法

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值