前言
1 随机性时间序列模型
时间序列分析方法是通过对样本观测值的观察分析,将时间序列的趋势项、周期项和随机项分解出来。
其中,对于趋势性或周期性变化,常用确定性时序分析,而对于余下的随机项,可用随机时序模型拟合,属于随机时序分析。确定和随机两部分组合起来共同描述一个时间序列。
随机性时间序列模型最早由G.E.P.Box和G.M.Jenkins提出。
1.1 基本概念
1.1.1 随机过程概念
设
T
T
T是负无穷到正无穷的子集,如果
∀
t
∈
T
\forall t\in T
∀t∈T,都有一个随机变量与之对应,就称为随机变量的集合为随机过程。
当
T
T
T是全体整数或全体非负整数时,称相应的随机过程为离散随机过程。把随机序列的指标集合
T
T
T看成时间指标时,这个随机序列就是离散时间序列。
当
T
T
T是全体实数或全体非负实数时,称相应的随机过程为连续随机过程。把随机序列的指标集合
T
T
T看成时间指标时,这个随机序列就是连续时间序列。
1.1.2 几个重要的平稳随机过程
白噪声(纯随机过程)
设 a t {a_t} at为平稳序列,对于 ∀ t ∈ N \forall t\in N ∀t∈N,都有
E
(
a
t
)
=
μ
E(a_t)=\mu
E(at)=μ
C
O
V
(
a
t
,
a
s
)
=
{
σ
a
2
,
(
t
=
s
)
0
,
t
≠
s
COV(a_t,a_s) = \left\{ \begin{aligned} \ \sigma^2_a, (t=s) \\ \ 0, t\neq s \end{aligned} \right.
COV(at,as)={ σa2,(t=s) 0,t=s
独立增量随机过程
对于 ∀ n , t i ∈ T ( i = 1 , 2 , . . . , n ; t 1 < t 2 < . . . < t n ) \forall n,t_i \in T(i=1,2,...,n; t_1<t_2<...<t_n) ∀n,ti∈T(i=1,2,...,n;t1<t2<...<tn),随机变量 X ( t 2 ) − X ( t 1 ) , X ( t 3 ) − X ( t 2 ) , . . . , X ( t n ) − X ( t n − 1 ) X(t_2)-X(t_1), X(t_3)-X(t_2),...,X(t_n)-X(t_n-1) X(t2)−X(t1),X(t3)−X(t2),...,X(tn)−X(tn−1)都相互独立,则称随机过程 { X t } = { X t : t ∈ T } \{X_t\}=\{X_t:t\in T\} {Xt}={Xt:t∈T}为独立增量随机过程
二阶矩过程与宽平稳过程
对于
∀
t
∈
T
,
X
t
\forall t \in T,X_t
∀t∈T,Xt的均值和方差存在,则称此过程为二阶矩过程。
若随机过程
{
X
t
,
t
∈
T
}
\{X_t, t \in T\}
{Xt,t∈T}是一个二阶矩过程,且满足:
E
X
t
=
μ
,
∀
t
∈
T
E
[
X
t
+
τ
]
[
X
t
−
μ
]
=
γ
τ
,
∀
t
,
t
+
τ
∈
T
EX_t=\mu, \forall t\in T \\ \ \\ E[X_{t+\tau}][X_t-\mu]=\gamma_\tau, \forall t,t+\tau \in T
EXt=μ,∀t∈T E[Xt+τ][Xt−μ]=γτ,∀t,t+τ∈T
则称
{
X
t
,
t
∈
T
}
\{X_t,t\in T \}
{Xt,t∈T}为宽平稳随机过程。
注意:白噪声为宽平稳随机过程,平稳时间序列中讨论的都为宽平稳随机序列。
严平稳随机过程
对于
∀
t
i
(
i
=
1
,
2
,
.
.
.
,
n
)
\forall t_i(i=1,2,...,n)
∀ti(i=1,2,...,n)和任意实数
s
s
s,随机过程
{
X
t
}
\{X_t\}
{Xt}的
n
n
n维分布函数满足关系式,即为严平稳随机过程:
F
n
(
X
1
,
X
2
,
.
.
.
,
X
n
;
t
1
,
t
2
,
.
.
.
,
t
n
)
=
F
n
(
X
1
,
X
2
,
.
.
.
,
X
n
;
t
1
+
s
,
t
2
+
s
,
.
.
.
,
t
n
+
s
)
F_n(X_1,X_2,...,X_n;t_1,t_2,...,t_n)=F_n(X_1,X_2,...,X_n;t_1+s,t_2+s,...,t_n+s)
Fn(X1,X2,...,Xn;t1,t2,...,tn)=Fn(X1,X2,...,Xn;t1+s,t2+s,...,tn+s)
二阶矩存在的严平稳随机过程一定是宽平稳随机过程,反之不成立。
正态过程
若 { X t , t ∈ T } \{X_t, t\in T\} {Xt,t∈T}的有限维分布都是正态分布,则称 { X t , t ∈ T } \{X_t, t \in T\} {Xt,t∈T}为正态随机过程。
1.1.3 动态性
动态性:系统现在的行为与其历史行为的相关性,也就是系统的记忆性,具体地,就是在某一时刻进入系统的输入对系统后续行为的影响,如果该输入只影响系统下一时刻的行为,而对下一时刻以后的行为不发生作用,那么系统就有一阶动态或一期记忆性。
那么以此类推,如果该输入对系统之后的
n
n
n个时刻的行为都有影响,那么就说系统具有
n
n
n阶动态性。例如,
n
n
n阶自回归模型(
A
R
(
n
)
AR(n)
AR(n))为:
X
t
=
ϕ
1
X
t
−
1
+
ϕ
2
X
t
−
2
+
.
.
.
+
ϕ
n
X
t
−
n
+
a
t
X_t = \phi_1 X_{t-1}+\phi_2 X_{t-2}+...+\phi_n X_{t-n}+a_t
Xt=ϕ1Xt−1+ϕ2Xt−2+...+ϕnXt−n+at
基本假设:Xt仅与X_{t-1}、X_{t-2}、X_{t-3}等有线性关系,a_{t}为独立同分布的正态序列
一种有意思的理解:n阶自回归模型就是将Xt中依赖于X_{t-1}、X_{t-2}、X_{t-3}等与过去相关的成分剥离掉,得到一个独立的时间序列a_{t}
而a_{t}作为白噪声序列,对过去没有记忆性
与
A
R
(
n
)
AR(n)
AR(n)模型对比来看,
M
A
(
m
)
MA(m)
MA(m)模型描述的是系统对过去时刻进入系统的噪声的记忆:
X
t
=
a
t
−
θ
1
a
t
−
1
−
θ
2
a
t
−
2
−
.
.
.
−
θ
m
a
t
−
m
X_t = a_t-\theta_1 a_{t-1}-\theta_2 a_{t-2}-...-\theta_m a_{t-m}
Xt=at−θ1at−1−θ2at−2−...−θmat−m
基本假设:Xt仅与a_{t-1}、a_{t-2}、a_{t-3}等有线性关系,a_{t}为独立同分布的正态序列
该系统在t时刻的响应Xt与过去时刻的响应X_{t-1}、X_{t-2}、X_{t-3}等无关,而与过去t-1、t-2等时刻进入系统的扰动a_{t-1}、a_{t-2}、a_{t-3}存在着一定的相关关系,于是去掉这种相关关系以后,得到一个独立序列a_{t}
综合来看,
A
R
M
A
(
n
,
m
)
ARMA(n,m)
ARMA(n,m)描述的是系统对过去自身状态以及各时刻进入的噪声的记忆。
X
t
−
ϕ
1
X
t
−
1
−
ϕ
2
X
t
−
2
−
.
.
.
−
ϕ
n
X
t
−
n
=
a
t
−
θ
1
a
t
−
1
−
θ
2
a
t
−
2
−
.
.
.
−
θ
m
a
t
−
m
X_t-\phi_1 X_{t-1}-\phi_2 X_{t-2}-...-\phi_n X_{t-n} \\=a_t-\theta_1 a_{t-1}-\theta_2 a_{t-2}-...-\theta_m a_{t-m}
Xt−ϕ1Xt−1−ϕ2Xt−2−...−ϕnXt−n=at−θ1at−1−θ2at−2−...−θmat−m
注意:
(1) AR(n)、MA(n)、ARMA(n,m)模型都是ARMA(n,n-1)的特殊情形
(2) 对于平稳系统,都可以用一个ARMA(n,n-1)模型近似得到想要得到的任意程度
(3) 对于n阶自回归部分,移动平均部分的阶数应当为n-1
而对于一般ARMA(n,m)模型中m!=n-1的情形,实际上是ARMA(n,n-1)模型的\phi或\theta为0的特殊情形
从连续系统的离散化过程来看,ARMA(n,n-1)模型也是合理的
2 算子
2.1 差分算子
以
A
R
(
1
)
AR(1)
AR(1)模型为例:
X
t
=
X
t
−
1
+
a
t
X_t = X_{t-1}+a_t
Xt=Xt−1+at
即随机游走模型,该系统对过去有很强的惯性,与过去强相关,当Xt从t时刻移至t-1时刻时,若没有随机项a_{t},则Xt的值保持不变(完全的记忆性),但是就是因为这个a_{t},Xt的值才不确定。由于随机项a_{t}主宰X的增量大小,所以才称为随机游走模型
即有下式,其中
∇
\nabla
∇表示差分算子:
∇
X
t
=
a
t
\nabla X_t = a_t
∇Xt=at
除此之外,我们称
Y
t
=
X
t
−
X
t
−
1
Y_t=X_t - X_{t-1}
Yt=Xt−Xt−1叫做关于
X
t
X_t
Xt的一阶差分,记为:
Y
t
=
∇
X
t
Y_t = \nabla X_t
Yt=∇Xt
由此递归,则称
Z
t
=
Y
t
−
Y
t
−
1
Z_t=Y_t - Y_{t-1}
Zt=Yt−Yt−1叫做关于
Y
t
Y_t
Yt的一阶差分,也是关于
X
t
X_t
Xt的二阶差分,记为:
Z
t
=
∇
Y
t
=
X
t
−
X
t
−
1
−
X
t
−
1
+
X
t
−
2
=
∇
2
X
t
Z_t = \nabla Y_t=X_t - X_{t-1}-X_{t-1} + X_{t-2}=\nabla^2X_t
Zt=∇Yt=Xt−Xt−1−Xt−1+Xt−2=∇2Xt
类似地,设
X
t
X_t
Xt地第
k
−
1
k-1
k−1次差分为
W
t
W_t
Wt,则称
W
t
−
W
t
−
1
W_t-W_{t-1}
Wt−Wt−1为
X
t
X_t
Xt的
k
k
k阶差分。
注意:k阶差分不是简单的$X_t - X_{t-k}$,而是叠加差分。
2.2 格林函数
同样以
A
R
(
1
)
AR(1)
AR(1)模型为例:
X
t
=
X
t
−
1
+
a
t
X_t = X_{t-1}+a_t
Xt=Xt−1+at
对应的齐次差分方程的通解为:
X
t
=
c
φ
1
t
,
t
∈
Z
X_t = c\varphi_1^t, t\in Z
Xt=cφ1t,t∈Z
由
A
R
(
1
)
AR(1)
AR(1)右边的形式可知,模型的特解可能是
{
a
t
}
\{a_t\}
{at}序列的线性组合:
X
t
=
φ
1
X
t
−
1
+
a
t
=
φ
1
(
φ
2
X
t
−
2
+
a
t
−
1
)
+
a
t
=
φ
1
2
X
t
−
2
+
φ
1
a
t
−
1
+
a
t
=
φ
1
2
(
φ
X
t
−
3
+
a
t
−
2
)
+
φ
1
a
t
−
1
+
a
t
=
φ
3
X
t
−
3
+
φ
2
a
t
−
2
+
φ
1
a
t
−
1
+
a
t
.
.
.
=
∑
j
=
0
∞
φ
1
j
a
t
−
j
\begin{aligned} X_t &= \varphi_1X_{t-1}+a_t \\ &= \varphi_1(\varphi_2X_{t-2}+a_{t-1})+a_t \\ &=\varphi_1^2X_{t-2}+\varphi_1a_{t-1}+a_t \\ &=\varphi_1^2(\varphi X_{t-3}+a_{t-2})+\varphi_1a_{t-1}+a_t \\ &=\varphi^3X_{t-3}+\varphi^2a_{t-2}+\varphi_1a_{t-1}+a_{t} \\ &... \\ &=\sum^{\infty}_{j=0}\varphi_1^{j}a_{t-j} \end{aligned}
Xt=φ1Xt−1+at=φ1(φ2Xt−2+at−1)+at=φ12Xt−2+φ1at−1+at=φ12(φXt−3+at−2)+φ1at−1+at=φ3Xt−3+φ2at−2+φ1at−1+at...=j=0∑∞φ1jat−j
则
A
R
(
1
)
AR(1)
AR(1)的通解为:
X
t
=
∑
j
=
0
∞
φ
1
j
a
t
−
j
+
c
φ
1
t
X_t=\sum^{\infty}_{j=0}\varphi_1^{j}a_{t-j}+c\varphi_1^t
Xt=j=0∑∞φ1jat−j+cφ1t
当|\varphi_{t}|<1时,t趋近于正无穷,则c\varphi_1^{t}趋近于0,则Xt完全被特解部分决定,也就是独立序列a_{t-j}部分确定
若|\varphi_{t}|>1时,则通解部分与特解部分均发散,这样的话就没有接下来的统计学意义了
(个人理解:第一,统计学预测意义角度,之后是将时间序列用于预测,如果发散,则并没有找到时间序列中的统计学规律,那么这样预测也是无意义的,故需要施加一个平稳性条件,之后的所有时间序列分析也是建立在平稳性假设条件基础上的预测;第二,遍历性角度。由于之后许多处理需要对不同t时刻进行期望方差计算,如果不同时刻的期望不同那么就非常麻烦了,就需要整个序列先平稳,也就是收敛到同一期望值,那么就方便了遍历计算)
而其中系数函数
φ
1
j
\varphi_1^j
φ1j客观地描述了该系数地动态性,故称此系数为格林函数,用
G
j
G_j
Gj表示:
G
j
=
φ
1
j
G_j = \varphi_1^j
Gj=φ1j
A
R
(
1
)
AR(1)
AR(1)的特解也可以改写为:
X
t
=
∑
j
=
0
∞
G
j
a
t
−
j
X_t=\sum^{\infty}_{j=0}G_ja_{t-j}
Xt=j=0∑∞Gjat−j
或:
X
t
=
∑
k
=
−
∞
t
G
t
−
k
a
k
X_t=\sum^{t}_{k=-\infty}G_{t-k}a_{k}
Xt=k=−∞∑tGt−kak
2.3 后移算子
后移算子
B
B
B表示后移的期数,如:
B
j
X
t
=
X
t
−
j
B^jX_t=X_{t-j}
BjXt=Xt−j
具有如下性质:
- 对和 t t t无关的随机变量 Y Y Y有: B Y = Y BY=Y BY=Y
- 对整数 n n n,常数 a a a有: B n ( a X t ) = a B n X t = a X t − n B^n(aX_t)=aB^nX_t=aX_{t-n} Bn(aXt)=aBnXt=aXt−n
- 对整数 n , m n,m n,m有: B n + m ( X t ) = B n B m X t = X t − n − m B^{n+m}(X_t)=B^nB^mX_t=X_{t-n-m} Bn+m(Xt)=BnBmXt=Xt−n−m
- 对多项式 ψ ( z ) = ∑ j = 0 p c j z j \psi(z)=\sum^p_{j=0}c_jz^j ψ(z)=∑j=0pcjzj,有: ψ ( B ) X t = ∑ j = 0 p c j X t − j \psi(B)X_t=\sum^p_{j=0}c_jX_{t-j} ψ(B)Xt=j=0∑pcjXt−j
- 对多项式
ψ
(
z
)
=
∑
j
=
0
p
c
j
z
j
\psi(z)=\sum^p_{j=0}c_jz^j
ψ(z)=∑j=0pcjzj和
φ
(
z
)
=
∑
j
=
0
q
d
j
z
j
\varphi(z)=\sum^q_{j=0}d_jz^j
φ(z)=∑j=0qdjzj的乘积
f
(
z
)
=
ψ
(
z
)
φ
(
z
)
f(z)=\psi(z)\varphi(z)
f(z)=ψ(z)φ(z),有:
f ( B ) X t = ψ ( B ) [ φ ( B ) X t ] = φ ( B ) [ ψ ( B ) X t ] f(B)X_t=\psi(B)[\varphi(B)X_t]=\varphi(B)[\psi(B)X_t] f(B)Xt=ψ(B)[φ(B)Xt]=φ(B)[ψ(B)Xt] - 对时间序列 X t , Y t X_t,Y_t Xt,Yt而言,多项式 ψ ( z ) = ∑ j = 0 p c j z j \psi(z)=\sum^p_{j=0}c_jz^j ψ(z)=∑j=0pcjzj和随机变量U,V,W,有: ψ ( B ) ( U X t + V Y t + W ) = U ψ ( B ) X t + V ψ ( B ) Y t + W ψ ( 1 ) \psi(B)(UX_t+VY_t+W)=U\psi(B)X_t+V\psi(B)Y_t+W\psi(1) ψ(B)(UXt+VYt+W)=Uψ(B)Xt+Vψ(B)Yt+Wψ(1)
2.4 逆函数
在一定条件下,所有模型也可以转化为无限阶的AR模型,即:
X
t
=
I
1
X
t
−
1
+
I
2
X
t
−
2
+
.
.
.
+
a
t
=
∑
j
=
1
∞
I
j
X
t
−
j
+
a
t
\begin{aligned} X_t &= I_1X_{t -1}+I_2X_{t -2} + ... + a_t \\ & = \sum_{j=1}^\infty I_jX_{t-j} + a_t \end{aligned}
Xt=I1Xt−1+I2Xt−2+...+at=j=1∑∞IjXt−j+at
或:
a
t
=
(
1
−
∑
j
=
1
∞
I
j
X
t
−
j
)
X
t
=
(
1
−
I
1
B
−
I
2
B
2
−
.
.
.
)
X
t
=
∑
j
=
0
∞
(
−
I
j
)
B
j
X
t
,
(
I
0
=
−
1
)
\begin{aligned} a_t &= (1-\sum_{j=1}^\infty I_jX_{t-j}) X_t\\ & = (1-I_1B-I_2B^2-...)X_t \\ & = \sum_{j=0}^\infty (-I_j)B^{j} X_t \end{aligned}, (I_0 = -1)
at=(1−j=1∑∞IjXt−j)Xt=(1−I1B−I2B2−...)Xt=j=0∑∞(−Ij)BjXt,(I0=−1)
上式被称为
X
t
X_t
Xt的逆转形式,其中
I
j
I_j
Ij称为逆函数。一个过程是否具有逆转形式,称为过程是否具有可逆性,或是否可逆。
2.5 格林函数与逆函数的对偶转换
利用对偶性求得一种模型的格林函数或逆函数,就可以直接得到与其对偶的模型的逆函数或格林函数。
具体做法为,在ARMA(n,m)的格林函数中用
−
I
j
-I_j
−Ij代替
G
j
G_j
Gj,
φ
\varphi
φ和
θ
\theta
θ相互代替:
例如,ARMA(1,2)的格林函数为:
{
G
1
=
φ
1
−
θ
1
G
2
=
φ
1
G
1
−
θ
2
G
j
=
φ
1
G
j
−
1
,
(
j
≥
3
)
\begin{cases} G_1 = \varphi_1-\theta_1\\ G_2 = \varphi_1G_1 - \theta_2 \\ G_j = \varphi_1G_{j-1}, (j\geq3) \end{cases}
⎩
⎨
⎧G1=φ1−θ1G2=φ1G1−θ2Gj=φ1Gj−1,(j≥3)
ARMA(2,1)的逆函数为:
{
I
1
=
φ
1
−
θ
1
I
2
=
φ
2
−
I
1
θ
1
I
j
=
θ
1
I
j
−
1
,
(
j
≥
3
)
\begin{cases} I_1 = \varphi_1-\theta_1\\ I_2 = \varphi_2 - I_1\theta_1 \\ I_j = \theta_1I_{j-1}, (j\geq3) \end{cases}
⎩
⎨
⎧I1=φ1−θ1I2=φ2−I1θ1Ij=θ1Ij−1,(j≥3)
3 平稳性与可逆性
对于ARMA模型来说,只有平稳且可逆才是有意义的,一般总是假定模型既平稳又可逆。
3.1 平稳性条件
对于ARMA(n,n-1)模型平稳性条件的参数形式,一般是先求得模型格林函数的显性表达式,然后看
x
t
x_t
xt收敛时,特征根
λ
1
,
λ
2
,
.
.
.
,
λ
n
\lambda_1,\lambda_2,...,\lambda_n
λ1,λ2,...,λn需要达到的要求是什么,特征根
λ
n
\lambda_n
λn与参数
φ
n
\varphi_n
φn关系转换后,即为是由参数
φ
1
,
φ
2
,
.
.
.
,
φ
n
,
\varphi_1,\varphi_2,...,\varphi_n,
φ1,φ2,...,φn,构成的n+1个不等式。
平稳性仅与自回归参数有关,而与移动平均参数无关。
3.1.1 ARMA(1,m)
平稳性条件:
∣
φ
1
∣
<
1
|\varphi_1|<1
∣φ1∣<1
3.1.2 ARMA(2,m)
平稳性条件:
{
φ
1
+
φ
2
<
1
φ
2
−
φ
1
<
1
∣
φ
2
∣
<
1
\begin{cases} \varphi_1+\varphi_2<1\\ \varphi_2 - \varphi_1 <1 \\ |\varphi_2|<1 \end{cases}
⎩
⎨
⎧φ1+φ2<1φ2−φ1<1∣φ2∣<1
3.2 可逆性条件
可逆性与移动平均参数有关,而与自回归参数无关。
3.2.1 ARMA(n,1)
平稳性条件:
∣
θ
1
∣
<
1
|\theta_1|<1
∣θ1∣<1
3.2.2 ARMA(n,2)
平稳性条件:
{
θ
1
+
θ
2
<
1
θ
2
−
θ
1
<
1
∣
θ
2
∣
<
1
\begin{cases} \theta_1+\theta_2<1\\ \theta_2 - \theta_1 <1 \\ |\theta_2|<1 \end{cases}
⎩
⎨
⎧θ1+θ2<1θ2−θ1<1∣θ2∣<1
4 分解
4.1 Wold分解
回顾
A
R
(
1
)
AR(1)
AR(1)模型的特解为下式,下式也被成为Wold分解式,
G
j
G_j
Gj也叫Wold系数:
X
t
=
∑
j
=
0
∞
=
G
j
a
t
−
j
X_t = \sum^\infty_{j=0} =G_ja_{t-j}
Xt=j=0∑∞=Gjat−j
由于
a
t
−
j
a_{t-j}
at−j为相互独立的(模型假设),所以可以看作线性空间的基,
X
t
X_t
Xt可由
a
t
−
j
a_{t-j}
at−j进行线性表示。其系数
G
j
G_j
Gj是
X
t
X_t
Xt对于
a
t
−
j
a_{t-j}
at−j的坐标投影,
X
t
X_t
Xt是
G
j
a
t
−
j
G_ja_{t-j}
Gjat−j的正交向量和。
也就是说,用线性空间来审视上式,即为wold分解。
5 模型识别
5.1 Box-Jenkins法
即根据样本自相关、偏自相关函数的截尾性和拖尾性初步判断序列所适合的模型类型。
- 零均值化
- 样本自相关函数
ρ k ^ = ∑ t = 1 n − k ( x t − x ˉ ) ( x t − k − x ˉ ) ∑ t = 1 n ( x t − x ˉ ) 2 \hat{\rho_k} = {\sum_{t=1}^{n-k}(x_t-\bar{x}) (x_{t-k}-\bar{x})\over \sum_{t=1}^{n}(x_t-\bar{x})^2} ρk^=∑t=1n(xt−xˉ)2∑t=1n−k(xt−xˉ)(xt−k−xˉ) - 样本偏自相关函数
ϕ k k ^ = D k ^ D ^ \hat{\phi_{kk}} = {\hat{D_k } \over \hat D} ϕkk^=D^Dk^ - 根据截尾和拖尾判断模型
| 自相关函数 | 偏自相关函数 | 选择模型 |
| 拖尾 | p阶截尾 | AR(p) |
| q阶截尾 | 拖尾 | MA(q) |
| 拖尾 | 拖尾 | ARMA(p,q) |
6.1.1 矩估计
6.1.2 极大似然估计
6.1.3 条件最小二乘估计
条件最小二乘估计是实际中最常用的参数估计方法,假设条件为:
a
t
−
1
=
a
t
−
2
=
.
.
.
=
a
t
−
q
=
0
a_{t-1}=a_{t-2}=...=a_{t-q}=0
at−1=at−2=...=at−q=0
残差平方和方程为:
Q
(
β
^
)
=
∑
t
=
p
+
1
n
a
t
2
=
∑
t
=
p
+
1
n
[
X
t
−
∑
i
=
1
p
φ
i
X
t
−
i
+
∑
j
=
1
q
θ
j
a
t
−
j
]
2
Q(\hat\beta)=\sum^n_{t=p+1}a_t^2=\sum^n_{t=p+1}[X_t-\sum^p_{i=1}\varphi_iX_{t-i}+\sum^q_{j=1}\theta_ja_{t-j}]^2
Q(β^)=t=p+1∑nat2=t=p+1∑n[Xt−i=1∑pφiXt−i+j=1∑qθjat−j]2
解法:迭代法
优缺点:
- OLS估计充分应用每一个观察值提供的信息,因而估计精度高
- 条件OLS估计使用率较高
- 但是需要假定总体分布(缺点)
6.2 数值法
都是用迭代
6.2.1 线性迭代法
给出初始值,根据式子进行迭代计算,直至相邻两次迭代值相差不大时停止迭代,最后迭代结果作为近似解
本文介绍了时间序列分析的基本概念,包括随机过程、平稳性、可逆性等,并详细阐述了ARMA模型的特性及其参数估计方法。
412

被折叠的 条评论
为什么被折叠?



