自回归（AR）模型的功率谱估计

不负韶华ღ

已于 2022-11-29 16:54:26 修改

阅读量2.7k

点赞数 4

CC 4.0 BY-SA版权

分类专栏：脑机接口文章标签：回归 ar 数据挖掘

于 2022-11-25 23:24:42 首次发布

本文链接：https://blog.youkuaiyun.com/weixin_49346755/article/details/128015038

脑机接口专栏收录该内容

2 篇文章

订阅专栏

本文介绍了随机信号处理中的自回归滑动平均（ARMA）模型，包括自回归（AR）、滑动平均（MA）和ARMA模型的定义及它们之间的关系。重点阐述了如何利用自相关函数和Yule-Walker方程、Levinson-Durbin法、Burg法、协方差法和修正协方差法估计模型参数，并提供了每种方法的详细计算过程。此外，还讨论了自回归模型的功率谱估计方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

随机信号的参数模型

假定随机信号 $x (n)$ 是由白噪声 $w (n)$ 激励某一确定系统的响应。如下图所示：

在这里插入图片描述
随机信号 $x (n)$ 、白噪声 $w (n)$ 和系统的冲击响应 $h (n)$ 之间的关系为： $x(n)=h(n)∗w(n)=∑k=−∞+∞h(k)w(n−k)x(n)=h(n)*w(n)=\sum^{+\infin}_{k=-\infin}h(k)w(n-k)$ 其中， $*$ 为卷积操作。如果确定白噪声 $w (n)$ 的参数（假设为 $a_k$ ），也就相当于确定系统中的参数 $h (k)$ 。这样，就能将研究随机信号转化成研究产生随机信号的系统。

自回归滑动平均模型

在自回归滑动平均（Auto Regression Moving Average，ARMA）模型中，随机噪声 $x (n)$ 由白噪声 $w (n)$ 、信号的若干过去值 $x (n - k)$ 和若干激励值 $w (n - k)$ 线性组合而成。用线性差分方程表示为 $x(n)+∑k=1pakx(n−k)=w(n)+∑k=1pbkw(n−k)x(n)+\sum^p_{k=1}a_kx(n-k)=w(n)+\sum^p_{k=1}b_kw(n-k)$ 对两边进行z变换，有： $∑k=0pakX(z)z−k=∑k=0pbkW(z)z−k\sum^p_{k=0}a_kX(z)z^{-k}=\sum^p_{k=0}b_kW(z)z^{-k}$ 其中， $a_k$ 为模型的参数，p为模型的阶数。系统函数为： $H(z)=X(z)W(z)=∑k=0pbkz−k1+∑k=1pakz−kH(z)=\frac{X(z)}{W(z)}=\frac{\displaystyle\sum^p_{k=0}b_kz^{-k}}{1+\displaystyle\sum^p_{k=1}a_kz^{-k}}$

滑动平均模型

在滑动平均（Moving Average，MR）模型中，随机信号 $x (n)$ 由白噪声 $w (n)$ 和若干激励值 $w (n - k)$ 线性组合而成。用线性差分方程表示为： $x(n)=w(n)+∑k=1pbkw(n−k)x(n)=w(n)+\sum^p_{k=1}b_kw(n-k)$ 对两边进行z变换，有： $X(z)=∑k=0pbkW(z)z−kX(z)=\sum^p_{k=0}b_kW(z)z^{-k}$ 其中， $a_k$ 为模型的参数，p为模型的阶数。系统函数为： $H(z)=X(z)W(z)=X(z)=∑k=0pbkz−kH(z)=\frac{X(z)}{W(z)}=X(z)={\displaystyle\sum^p_{k=0}b_kz^{-k}}$

自回归模型

在自回归（Auto Regression，AR）模型中，随机信号 $x (n)$ 由白噪声 $w (n)$ 和信号本身的若干次过去值 $x (n - k)$ 线性组合而成。用线性差分方程表示为： $x(n)+∑k=1pakx(n−k)=w(n)x(n)+\sum^p_{k=1}a_kx(n-k)=w(n)$ 对两边进行z变换，有： $∑k=0pakX(z)z−k=W(z)\sum^p_{k=0}a_kX(z)z^{-k}=W(z)$ 其中， $a_k$ 为模型的参数，p为模型的阶数。系统函数为： $H(z)=X(z)W(z)=1W(z)=11+∑k=1pakz−kH(z)=\frac {X(z)} {W(z)}=\frac {1}{W(z)}=\frac {1}{1+\displaystyle{\sum^p_{k=1}a_kz^{-k}}}$

自回归模型的参数估计

信号处理中的自相关函数，反映同一个信号在不同时刻取值间的相关程度。信号的自相关函数和信号的功率谱密度互为傅里叶变换，通过信号的自相关函数可以求得信号的功率谱密度。

随机噪声 $x (n)$ 的自相关函数 $R_{xx}(m)$ 为： $R_{xx}(m)=E[x(n)x(n+m)]$ 将随机信号 $x (n)$ 的表达式代入，得： $Rxx(m)=E{x(n)[w(n+m)−∑k=1pakx(n+m−k)]}=E[x(n)w(n+m)]−∑k=1pakE[x(n)x(n+m−k)]=Rxw(m)−∑k=1pakRxx(m−k)\begin{aligned}R_{xx}(m)&=E\{x(n)[w(n+m)-\sum^p_{k=1}a_kx(n+m-k)]\}\\&=E[x(n)w(n+m)]-\sum^p_{k=1}a_kE[x(n)x(n+m-k)]\\&=R_{xw}(m)-\sum^p_{k=1}a_kR_{xx}(m-k)\end{aligned}$ 由于 $Rxw(m)={σp2m=00m>0R_{xw}(m)=\begin{cases}\sigma^2_p&\text{m=0}\\0&\text{m>0}\end{cases}$ 则自相关函数 $R_{xx}(m)$ 可以表示为： $Rxx(m)={σp2−∑k=1pakRxx(m−k)m=0−∑k=1pakRxx(m−k)m>0R_{xx}(m)=\begin{cases}\sigma^2_p-\displaystyle\sum^p_{k=1}a_kR_{xx}(m-k)&\text{m=0}\\ -\displaystyle\sum^p_{k=1}a_kR_{xx}(m-k) &\text{m>0}\end{cases}$ 其中， $m = 0, 1, . . ., p$ 。用矩阵（Yule-Walker方程）可以表示为： $\begin{bmatrix} R_{xx}(0)&R_{xx}(-1)&\cdots&R_{xx}(-p)\\ R_{xx}(1)&R_{xx}(0)&\cdots&R_{xx}(1-p)\\ \vdots&\vdots&\ddots&\vdots\\ R_{xx}(p)&R_{xx}(p-1)&\cdots&R_{xx}(0)\\ \end{bmatrix} \begin{bmatrix} 1\\ a_1\\ \vdots\\ a_p \end{bmatrix}= \begin{bmatrix} \sigma^2_p\\ 0\\ \vdots\\ 0\\ \end{bmatrix}$ 目前，求解Yule-Walker方程的方法主要有Yule-Walker法、Levinson-Durbin法、Burg法、协方差法和修正协方差法这五种，这五种方法有各自的优缺点。下面分别介绍这五种方法：

Yule-Walker法（预测误差最小）

对于预测模型，假设第n个数据 $x (n)$ 是由前p个数据 $x (n - p), x (n - p + 1), . . ., x (n - 1)$ 预测得到的。即： $x^(n)=−∑k=1pakx(n−k)\hat{x}(n)=-\sum^p_{k=1}a_kx(n-k)$ 那么预测误差 $e (n)$ 为： $e(n)=x(n)+x^(n)=x(n)+∑k=1pakx(n−k)e(n)=x(n)+\hat{x}(n)=x(n)+\sum^p_{k=1}a_kx(n-k)$ 而对于自回归（AR）模型而言，有： $w(n)=x(n)+∑k=1pakx(n−k)w(n)=x(n)+\sum^p_{k=1}a_kx(n-k)$ 如果自回归模型和预测模型的系数 $a_k$ 相同，那么预测误差 $e (n)$ 就等于白噪声 $w (n)$ 。因此，Yule-Walker法的基本思想就是计算预测误差功率 $ρe\rho_e$ 最小时模型的预测系数 $a_k$ ： $ρe=1NE[e2(n)]=1NE[x(n)+∑k=1pakx(n−k)]2\rho_e=\frac 1 N E[e^2(n)]=\frac{1}{N}E[x(n)+\sum^p_{k=1}a_kx(n-k)]^2$ 为了使预测误差功率最小，有： $∂ρe∂ak=∂E[e2(n)]∂ak=0\frac{\partial{\rho_e}}{\partial a_k}=\frac{\partial{E[e^2(n)}]}{\partial a_k}=0$ 而 $E[e2(n)]=E{[x(n)+∑k=1pakx(n−k)]2}=E[x2(n)]+2∑k=1pakE[x(n)x(n−k)]+∑i=1pai∑k=1pakE[x(n−i)x(n−k)]=Rxx(0)+2∑k=1pakRxx(k)+∑i=1pai∑k=1pakRxx(i−k)\begin{aligned}E[e^2(n)]&=E\{[x(n)+\sum^p_{k=1}a_kx(n-k)]^2\}\\&=E{[x^2(n)]}+2\sum^p_{k=1}a_kE[x(n)x(n-k)]+\sum^p_{i=1}a_i\sum^p_{k=1}a_kE[x(n-i)x(n-k)]\\&=R_{xx}(0)+2\sum^p_{k=1}a_kR_{xx}(k)+\sum^p_{i=1}a_i\sum^p_{k=1}a_kR_{xx}(i-k)\end{aligned}$ 则有： $∂E[e2(n)]∂ak=2Rxx(k)+2∑i=1paiRxx(i−k)=0\frac{\partial{E[e^2(n)}]}{\partial a_k}=2R_{xx}(k)+2\sum^p_{i=1}a_iR_{xx}(i-k)=0$ 即： $∑i=1paiRxx(i−k)=−Rxx(k)\sum^p_{i=1}a_iR_{xx}(i-k)=-R_{xx}(k)$ 其中， $k = 1, 2, . . ., p$ 。写成矩阵形式： $\begin{bmatrix} R_{xx}(0)&R_{xx}(1)&\cdots&R_{xx}(p-1)\\ R_{xx}(-1)&R_{xx}(0)&\cdots&R_{xx}(p-2)\\ \vdots&\vdots&\ddots&\vdots\\ R_{xx}(1-p)&R_{xx}(2-p)&\cdots&R_{xx}(0)\\ \end{bmatrix} \begin{bmatrix} a_1\\ a_2\\ \vdots\\ a_p \end{bmatrix}= \begin{bmatrix} -R_{xx}(1)\\ -R_{xx}(2)\\ \vdots\\ -R_{xx}(p)\\ \end{bmatrix}$
则预测系数 $a_k$ 可以表示成： $\begin{bmatrix} a_1\\ a_2\\ \vdots\\ a_p \end{bmatrix}= \begin{bmatrix} R_{xx}(0)&R_{xx}(1)&\cdots&R_{xx}(p-1)\\ R_{xx}(-1)&R_{xx}(0)&\cdots&R_{xx}(p-2)\\ \vdots&\vdots&\ddots&\vdots\\ R_{xx}(1-p)&R_{xx}(2-p)&\cdots&R_{xx}(0)\\ \end{bmatrix}^{-1} \begin{bmatrix} -R_{xx}(1)\\ -R_{xx}(2)\\ \vdots\\ -R_{xx}(p)\\ \end{bmatrix}$
然后根据模型的系数 $a_k$ 求 $σp2\sigma^2_p$ ： $σp2=Rxx(0)+∑k=1pakRxx(−k)\sigma^2_p=R_{xx}(0)+\sum^p_{k=1}a_kR_{xx}(-k)$

Levinson-Durbin法（递归）

假设 $p$ 阶自回归模型的系数为 $a_{pk}$ ，其中 $p$ 表示此时自回归模型的阶数，也就是当前阶数情况下总共有几个系数， $k$ 表示当前系数的序列索引。对于Yule-Walker方程，

当 $p = 1$ 时，有： $\begin{bmatrix} R_{xx}(0)&R_{xx}(1)\\ R_{xx}(1)&R_{xx}(0)\\ \end{bmatrix} \begin{bmatrix} 1\\ a_{11}\\ \end{bmatrix}= \begin{bmatrix} \sigma^2_1\\ 0\\ \end{bmatrix}$ 解得： $a11=−Rxx(1)Rxx(0)a_{11}=-\frac{R_{xx}(1)}{R_{xx}(0)}$ $\sigma^2_1=(1-|a_{11}|^2)R_{xx}(0)$ 当 $p = 2$ 时，有： $[Rxx(0)Rxx(1)Rxx(2)Rxx(1)Rxx(0)Rxx(1)Rxx(2)Rxx(1)Rxx(0)][1a21a22]=[σ2200]\begin{bmatrix} R_{xx}(0)&R_{xx}(1)&R_{xx}(2)\\ R_{xx}(1)&R_{xx}(0)&R_{xx}(1)\\ R_{xx}(2)&R_{xx}(1)&R_{xx}(0)\\ \end{bmatrix} \begin{bmatrix} 1\\ a_{21}\\ a_{22}\\ \end{bmatrix}= \begin{bmatrix} \sigma^2_2\\ 0\\ 0\\ \end{bmatrix}$ 解得： $a22=−Rxx(2)−a11Rxx(1)σ12a_{22}=-\frac{R_{xx}(2)-a_{11}R_{xx}(1)}{\sigma^2_1}$ $a_{21}=a_{11}+a_{22}a_{11}$ $σ22=(1−∣a22∣2σ12)\sigma^2_2=(1-|a_{22}|^2\sigma^2_1)$ 推广到 $k$ 阶时，有： $akk=−Rxx(k)−∑l=1k−1ak−1,lRxx(k−l)σk−12a_{kk}=-\frac{R_{xx}(k)-\displaystyle\sum^{k-1}_{l=1}a_{k-1,l}R_{xx}(k-l)}{\sigma^2_{k-1}}$ $a_{ki}=a_{k-1,i}+a_{kk}a_{k-1,k-i},i=1,2,...,k-1$ $σk2=(1−∣akk∣2)σk−12,σ02=Rxx(0)\sigma^2_k=(1-|a_{kk}|^2)\sigma^2_{k-1},\sigma^2_0=R_{xx}(0)$ Levinson-Durbin法的基本思想就是通过递归到所需要的阶数时，求得所估计的模型系数 $a_{pi},i=1,2,...,k$ 和 $σp2\sigma^2_p$ 。

Burg法（前后向平均预测误差最小+递归）

对于预测模型，假设随机信号 $x (n)$ 是由前 $p$ 个数据 $x (n - p), x (n - p + 1), . . ., x (n - 1)$ 预测得到的： $x^(n)=−∑k=1papkx(n−k)\hat{x}(n)=-\sum^p_{k=1}a_{pk}x(n-k)$ 则预测误差 $e_p(n)$ 为： $ep(n)=x(n)−x^(n)=x(n)+∑k=1papkx(n−k)e_p(n)=x(n)-\hat{x}(n)=x(n)+\sum^p_{k=1}a_{pk}x(n-k)$ 而随机信号 $x (n - p)$ 是由后 $p$ 个数据 $x (n - p + 1), x (n - p + 2), . . ., x (n)$ 预测得到的： $x^(n−p)=−∑k=1papkx(n−p+k)\hat{x}(n-p)=-\sum^p_{k=1}a_{pk}x(n-p+k)$ 则预测误差 $b_p(n)$ 为: $bp(n)=x(n−p)−x^(n−p)=x(n−p)+∑k=1papkx(n−p+k)b_p(n)=x(n-p)-\hat{x}(n-p)=x(n-p)+\sum^p_{k=1}a_{pk}x(n-p+k)$ 称 $e_p(n)$ 和 $b_p(n)$ 分别为前向预测误差和后向预测误差。Burg法的基本思想就是递归地求前后向预测误差平均功率 $ρp\rho_p$ 最小时的反射系数 $K_p=a_{pp}$ ，然后再根据反射系数 $K_p$ 求模型的参数 $a_{pk}$ 和 $σp2\sigma^2_{p}$ 。

假设随机信号 $x (n)$ 的观测区间为 $0≤n≤N−10\le n\le N-1$ ，则前向预测功率 $ρpe\rho_{pe}$ 、后向预测功率 $ρpb\rho_{pb}$ 和平均预测功率 $ρp\rho_{p}$ 分别为： $ρpe=1N−p∑n=pN−1∣ep(n)∣2=1N−p∑n=pN−1∣x(n)+∑k=1papkx(n−k)∣2\rho_{pe}=\frac{1}{N-p}\sum^{N-1}_{n=p}|e_p(n)|^2=\frac{1}{N-p}\sum^{N-1}_{n=p}|x(n)+\sum^p_{k=1}a_{pk}x(n-k)|^2$ $ρpb=1N−p∑n=pN−1∣bp(n)∣2=1N−p∑n=pN−1∣x(n−p)+∑k=1papkx(n−p+k)∣2\rho_{pb}=\frac{1}{N-p}\sum^{N-1}_{n=p}|b_p(n)|^2=\frac{1}{N-p}\sum^{N-1}_{n=p}|x(n-p)+\sum^p_{k=1}a_{pk}x(n-p+k)|^2$ $ρp=12(ρpe+ρpb)\rho_p=\frac{1}{2}(\rho_{pe}+\rho_{pb})$ 当反射系数最小时，有： $∂ρp∂Kp=0\frac{\partial{\rho_p}}{\partial{K_p}}=0$ 解得： $Kp=app=−2∑n=pN−1[ep−1(n)bp−1(n−1)]∑n=pN−1[ep−12(n)+bp−12(n−1)]K_p=a_{pp}=\frac{-2\displaystyle\sum^{N-1}_{n=p}[e_{p-1}(n)b_{p-1}(n-1)]}{\displaystyle\sum^{N-1}_{n=p}[e^2_{p-1}(n)+b^2_{p-1}(n-1)]}$ 由于 $e_0(n)=b_0(n)=x(n)$ ，且前向预测误差和后向预测误差分别存在递推公式： $e_p(n)=e_{p-1}(n)+K_pb_{p-1}(n-1)$ $b_p(n)=b_{p-1}(n-1)+K_pe_{p-1}(n)$ 故可以根据反射系数 $K_p$ 递推地求出模型的参数 $a_{pi}$ 和 $σp2\sigma^2_p$ ，有： $a_{pi}=a_{p-1,i}+K_pa_{p-1,p-i},i=1,2,...,p-1$ $σp2=(1−Kp2)σp−12\sigma^2_p=(1-K_p^2)\sigma^2_{p-1}$

协方差法（预测误差最小）

协方差法和Yule-Walker法都是通过最小化预测功率求模型的参数。但不同于Yule-Walker法，协方差法的预测功率为： $ρe=1N−p∑n=pN−1∣e2(n)∣=1N−p∑n=pN−1∣x(n)+∑k=1papkx(n−k)∣2\rho_e=\frac{1}{N-p}\sum^{N-1}_{n=p}|e^2(n)|=\frac{1}{N-p}\sum^{N-1}_{n=p}|x(n)+\sum^p_{k=1}a_{pk}x(n-k)|^2$ 当预测功率最小时，有： $∂ρe∂apk=1N−p∑n=pN−1[x(n)+∑k=1papkx(n−k)]x(n−l)=0\frac{\partial{\rho_e}}{\partial{a_{pk}}}=\frac{1}{N-p}\sum^{N-1}_{n=p}[x(n)+\sum^p_{k=1}a_{pk}x(n-k)]x(n-l)=0$ 其中， $l = 1, 2, . . ., p$ 。用 $c^xx(k,l)\hat{c}_{xx}(k,l)$ 来表示上式，得： $∑k=1papkc^xx(l,k)=−c^xx(l,0)\sum^p_{k=1}a_{pk}\hat{c}_{xx}(l,k)=-\hat{c}_{xx}(l,0)$ 其中： $c^xx(k,l)={1N−p∑n=pN−1[x(n−k)x(n−l)]c^xx(l,k)\hat{c}_{xx}(k,l)=\begin{cases}\displaystyle\frac{1}{N-p}\sum^{N-1}_{n=p}[x(n-k)x(n-l)]\\\hat{c}_{xx}(l,k)\end{cases}$ 写成矩阵形式为： $[c^xx(1,1)c^xx(1,2)⋯c^xx(1,p)c^xx(2,1)c^xx(2,2)⋯c^xx(2,p)⋮⋮⋱⋮c^xx(p,1)c^xx(p,2)⋯c^xx(p,p)][ap1ap2⋮app]=[−c^xx(1,0)−c^xx(2,0)⋮−c^xx(p,0)] \begin{bmatrix} \hat{c}_{xx}(1,1)&\hat{c}_{xx}(1,2)&\cdots&\hat{c}_{xx}(1,p)\\ \hat{c}_{xx}(2,1)&\hat{c}_{xx}(2,2)&\cdots&\hat{c}_{xx}(2,p)\\ \vdots&\vdots&\ddots&\vdots\\ \hat{c}_{xx}(p,1)&\hat{c}_{xx}(p,2)&\cdots&\hat{c}_{xx}(p,p)\\ \end{bmatrix} \begin{bmatrix} a_{p1}\\ a_{p2}\\ \vdots\\ a_{pp}\\ \end{bmatrix}= \begin{bmatrix} -\hat{c}_{xx}(1,0)\\ -\hat{c}_{xx}(2,0)\\ \vdots\\ -\hat{c}_{xx}(p,0)\\ \end{bmatrix}$ 则可以求出模型的参数 $a_{pk}$ ： $[ap1ap2⋮app]=[c^xx(1,1)c^xx(1,2)⋯c^xx(1,p)c^xx(2,1)c^xx(2,2)⋯c^xx(2,p)⋮⋮⋱⋮c^xx(p,1)c^xx(p,2)⋯c^xx(p,p)]−1[−c^xx(1,0)−c^xx(2,0)⋮−c^xx(p,0)] \begin{bmatrix} a_{p1}\\ a_{p2}\\ \vdots\\ a_{pp}\\ \end{bmatrix}= \begin{bmatrix} \hat{c}_{xx}(1,1)&\hat{c}_{xx}(1,2)&\cdots&\hat{c}_{xx}(1,p)\\ \hat{c}_{xx}(2,1)&\hat{c}_{xx}(2,2)&\cdots&\hat{c}_{xx}(2,p)\\ \vdots&\vdots&\ddots&\vdots\\ \hat{c}_{xx}(p,1)&\hat{c}_{xx}(p,2)&\cdots&\hat{c}_{xx}(p,p)\\ \end{bmatrix}^{-1} \begin{bmatrix} -\hat{c}_{xx}(1,0)\\ -\hat{c}_{xx}(2,0)\\ \vdots\\ -\hat{c}_{xx}(p,0)\\ \end{bmatrix}$

$σp2\sigma^2_p$ 的估计值： $σp2=ρmin=1N−p∑n=pN−1[x(n)+∑k=1papkx(n−k)][x(n)+∑l=1papkx(n−l)]=1N−p∑n=pN−1[x(n)+∑k=1papkx(n−k)]x(n)=c^xx(0,0)+∑k=1papkc^xx(0,k)\begin{aligned}\sigma^2_p=\rho_{min}&=\frac{1}{N-p}\sum^{N-1}_{n=p}[x(n)+\sum^p_{k=1}a_{pk}x(n-k)][x(n)+\sum^p_{l=1}a_{pk}x(n-l)]\\&=\frac{1}{N-p}\sum^{N-1}_{n=p}[x(n)+\sum^p_{k=1}a_{pk}x(n-k)]x(n)\\&=\hat{c}_{xx}(0,0)+\sum^p_{k=1}a_{pk}\hat{c}_{xx}(0,k)\end{aligned}$ 可以将参数 $a_{pk}$ 和 $σp2\sigma^2_p$ 的求解合并在一个矩阵中，有： $[c^xx(0,0)c^xx(0,1)⋯c^xx(0,p)c^xx(1,0)c^xx(1,1)⋯c^xx(1,p)⋮⋮⋱⋮c^xx(p,0)c^xx(p,1)⋯c^xx(p,p)][1ap1⋮app]=[σp20⋮0] \begin{bmatrix} \hat{c}_{xx}(0,0)&\hat{c}_{xx}(0,1)&\cdots&\hat{c}_{xx}(0,p)\\ \hat{c}_{xx}(1,0)&\hat{c}_{xx}(1,1)&\cdots&\hat{c}_{xx}(1,p)\\ \vdots&\vdots&\ddots&\vdots\\ \hat{c}_{xx}(p,0)&\hat{c}_{xx}(p,1)&\cdots&\hat{c}_{xx}(p,p)\\ \end{bmatrix} \begin{bmatrix} 1\\ a_{p1}\\ \vdots\\ a_{pp}\\ \end{bmatrix}= \begin{bmatrix} \sigma^2_p\\ 0\\ \vdots\\ 0\\ \end{bmatrix}$

修正协方差法（前后向平均预测误差最小）

修正的协方差法与Burg法类似，使用前后向预测平均误差最小的方法来估计自回归模型的参数。但不同于Burg法，修正的协方差法的后向预测误差 $b_p(n)$ 与Burg法中的后向预测误差不一样。

假设随机信号 $x (n)$ 是由前 $p$ 个数据 $x (n - p), x (n - p + 1), . . ., x (n - 1)$ 预测得到的，则有： $x^(n)=−∑k=1papkx(n−k)\hat{x}(n)=-\sum^p_{k=1}a_{pk}x(n-k)$ 在修正的协方差法中，前向预测误差 $e_p(n)$ 与Burg法中的前向预测误差一致： $ep(n)=x(n)−x^(n)=x(n)+∑k=1papkx(n−k)e_p(n)=x(n)-\hat{x}(n)=x(n)+\sum^p_{k=1}a_{pk}x(n-k)$ 对于后向预测误差 $b_p(n)$ ，假设随机信号 $x (n)$ 是由后 $p$ 个数据 $x (n + 1), x (n + 2), . . ., x (n + p)$ 预测得到的： $x^(n)=−∑k=1papkx(n+k)\hat{x}(n)=-\sum^p_{k=1}a_{pk}x(n+k)$ 那么，后向预测误差 $b_p(n)$ 可以表示为： $bp(n)=x(n)−x^(n)=x(n)+∑k=1papkx(n+k)b_p(n)=x(n)-\hat{x}(n)=x(n)+\sum^p_{k=1}a_{pk}x(n+k)$ 假设随机信号 $x (n)$ 的观测区间为 $0≤n≤N−10\le n\le N-1$ ，则前向预测功率 $ρpe\rho_{pe}$ 、后向预测功率 $ρpb\rho_{pb}$ 和平均预测功率 $ρp\rho_{p}$ 可以分别表示为： $ρpe=1N−p∑n=pN−1∣ep(n)∣2=1N−p∑n=pN−1∣x(n)+∑k=1papkx(n−k)∣2\rho_{pe}=\frac{1}{N-p}\sum^{N-1}_{n=p}|e_p(n)|^2=\frac{1}{N-p}\sum^{N-1}_{n=p}|x(n)+\sum^p_{k=1}a_{pk}x(n-k)|^2$ $ρpb=1N−p∑n=0N−1−p∣bp(n)∣2=1N−p∑n=0N−1−p∣x(n)+∑k=1papkx(n+k)∣2\rho_{pb}=\frac{1}{N-p}\sum^{N-1-p}_{n=0}|b_p(n)|^2=\frac{1}{N-p}\sum^{N-1-p}_{n=0}|x(n)+\sum^p_{k=1}a_{pk}x(n+k)|^2$ $ρp=12(ρpe+ρpb)\rho_p=\frac{1}{2}(\rho_{pe}+\rho_{pb})$ 要使平均误差功率 $ρp\rho_p$ 最小，则： $∂ρp∂apk=1N−p{∑n=pN−1[x(n)+∑k=1papkx(n−k)]x(n−l)+∑n=0N−1−p[x(n)+∑k=1papkx(n+k)]x(n+l)}=0\frac{\partial{\rho_p}}{\partial{a_{pk}}}=\frac{1}{N-p}\{\sum^{N-1}_{n=p}[x(n)+\sum^p_{k=1}a_{pk}x(n-k)]x(n-l)+\sum^{N-1-p}_{n=0}[x(n)+\sum^p_{k=1}a_{pk}x(n+k)]x(n+l)\}=0$ 其中， $l = 1, 2, . . ., p$ 。经过简化后，有： $∑k=1papk[∑n=pN−1x(n−k)x(n−l)+∑n=0N−1−px(n+k)x(n+l)]=−[∑n=pN−1x(n)x(n−l)+∑n=0N−1−px(n)x(n+l)]\sum^p_{k=1}a_{pk}[\sum^{N-1}_{n=p}x(n-k)x(n-l)+\sum^{N-1-p}_{n=0}x(n+k)x(n+l)]=-[\sum^{N-1}_{n=p}x(n)x(n-l)+\sum^{N-1-p}_{n=0}x(n)x(n+l)]$ 则上式可以表示为： $∑k=1papkc^xx(l,k)=−c^xx(l,0)\sum^p_{k=1}a_{pk}\hat{c}_{xx}(l,k)=-\hat{c}_{xx}(l,0)$ 其中： $c^xx(l,k)={12(N−p)∑n=pN−1x(n−k)x(n−l)+∑n=0N−1−px(n+k)x(n+l)c^xx(k,l)\hat{c}_{xx}(l,k)=\begin{cases}\displaystyle\frac{1}{2(N-p)}\sum^{N-1}_{n=p}x(n-k)x(n-l)+\sum^{N-1-p}_{n=0}x(n+k)x(n+l)\\\hat{c}_{xx}(k,l)\end{cases}$ 写成矩阵形式： $[c^xx(1,1)c^xx(1,2)⋯c^xx(1,p)c^xx(2,1)c^xx(2,2)⋯c^xx(2,p)⋮⋮⋱⋮c^xx(p,1)c^xx(p,2)⋯c^xx(p,p)][ap1ap2⋮app]=−[c^xx(1,0)c^xx(2,0)⋮c^xx(p,0)] \begin{bmatrix} \hat{c}_{xx}(1,1)&\hat{c}_{xx}(1,2)&\cdots&\hat{c}_{xx}(1,p)\\ \hat{c}_{xx}(2,1)&\hat{c}_{xx}(2,2)&\cdots&\hat{c}_{xx}(2,p)\\ \vdots&\vdots&\ddots&\vdots\\ \hat{c}_{xx}(p,1)&\hat{c}_{xx}(p,2)&\cdots&\hat{c}_{xx}(p,p)\\ \end{bmatrix} \begin{bmatrix} a_{p1}\\ a_{p2}\\ \vdots\\ a_{pp}\\ \end{bmatrix}=- \begin{bmatrix} \hat{c}_{xx}(1,0)\\ \hat{c}_{xx}(2,0)\\ \vdots\\ \hat{c}_{xx}(p,0)\\ \end{bmatrix}$ 则模型的参数 $a_{pk}$ 估计为： $[ap1ap2⋮app]=[c^xx(1,1)c^xx(1,2)⋯c^xx(1,p)c^xx(2,1)c^xx(2,2)⋯c^xx(2,p)⋮⋮⋱⋮c^xx(p,1)c^xx(p,2)⋯c^xx(p,p)]−1[−c^xx(1,0)−c^xx(2,0)⋮−c^xx(p,0)] \begin{bmatrix} a_{p1}\\ a_{p2}\\ \vdots\\ a_{pp}\\ \end{bmatrix}=\begin{bmatrix} \hat{c}_{xx}(1,1)&\hat{c}_{xx}(1,2)&\cdots&\hat{c}_{xx}(1,p)\\ \hat{c}_{xx}(2,1)&\hat{c}_{xx}(2,2)&\cdots&\hat{c}_{xx}(2,p)\\ \vdots&\vdots&\ddots&\vdots\\ \hat{c}_{xx}(p,1)&\hat{c}_{xx}(p,2)&\cdots&\hat{c}_{xx}(p,p)\\ \end{bmatrix}^{-1} \begin{bmatrix} -\hat{c}_{xx}(1,0)\\ -\hat{c}_{xx}(2,0)\\ \vdots\\ -\hat{c}_{xx}(p,0)\\ \end{bmatrix}$ 白噪声的方差 $σp2\sigma^2_p$ 估计为： $σp2=ρmin=12(N−p){∑n=pN−1[x(n)+∑k=1papkx(n−k)][x(n)+∑l=1papkx(n−l)]+∑n=0N−1−p[x(n)+∑k=1papkx(n+k)][x(n)+∑l=1papkx(n+l)]}=12(N−p){∑n=pN−1[x(n)+∑k=1papkx(n−k)]x(n)+∑n=0N−1−p[x(n)+∑k=1papkx(n+k)]x(n)}=12(N−p)[∑n=pN−1x2(n)+∑n=0N−1−px2(n)]+∑k=1papk{12(N−p)[∑n=pN−1x(n)x(n−k)+∑n=0N−1−px(n)x(n+k)]}=c^xx(0,0)+∑k=1papkc^xx(0,k)\begin{aligned}\sigma^2_p&=\rho_{min}\\&=\frac{1}{2(N-p)}\{\sum^{N-1}_{n=p}[x(n)+\sum^p_{k=1}a_{pk}x(n-k)][x(n)+\sum^p_{l=1}a_{pk}x(n-l)]+\sum^{N-1-p}_{n=0}[x(n)+\sum^p_{k=1}a_{pk}x(n+k)][x(n)+\sum^p_{l=1}a_{pk}x(n+l)]\}\\&=\frac{1}{2(N-p)}\{\sum^{N-1}_{n=p}[x(n)+\sum^p_{k=1}a_{pk}x(n-k)]x(n)+\sum^{N-1-p}_{n=0}[x(n)+\sum^p_{k=1}a_{pk}x(n+k)]x(n)\}\\&=\frac{1}{2(N-p)}[\sum^{N-1}_{n=p}x^2(n)+\sum^{N-1-p}_{n=0}x^2(n)]+\sum^p_{k=1}a_{pk}\{\frac{1}{2(N-p)}[\sum^{N-1}_{n=p}x(n)x(n-k)+\sum^{N-1-p}_{n=0}x(n)x(n+k)]\}\\&=\hat{c}_{xx}(0,0)+\sum^p_{k=1}a_{pk}\hat{c}_{xx}(0,k)\end{aligned}$ 合并成一个矩阵来求模型参数 $a_{pk}$ 和 $σp2\sigma^2_p$ ，则有： $[c^xx(0,0)c^xx(0,1)⋯c^xx(0,p)c^xx(1,0)c^xx(1,1)⋯c^xx(1,p)⋮⋮⋱⋮c^xx(p,0)c^xx(p,1)⋯c^xx(p,p)][1ap1⋮app]=−[σp20⋮0] \begin{bmatrix} \hat{c}_{xx}(0,0)&\hat{c}_{xx}(0,1)&\cdots&\hat{c}_{xx}(0,p)\\ \hat{c}_{xx}(1,0)&\hat{c}_{xx}(1,1)&\cdots&\hat{c}_{xx}(1,p)\\ \vdots&\vdots&\ddots&\vdots\\ \hat{c}_{xx}(p,0)&\hat{c}_{xx}(p,1)&\cdots&\hat{c}_{xx}(p,p)\\ \end{bmatrix} \begin{bmatrix} 1\\ a_{p1}\\ \vdots\\ a_{pp}\\ \end{bmatrix}=- \begin{bmatrix} \sigma^2_p\\ 0\\ \vdots\\ 0\\ \end{bmatrix}$

自回归模型的功率谱估计

当求出 $p$ 阶模型的参数 $a_k$ 和白噪声方差 $σp2\sigma^2_p$ ，就可以根据这些已知条件来计算模型的功率谱 $P_{xx}(e^{jw})$ ： $Pxx(ejw)=σp2∣H(ejw)∣2=σp2∣11+∑k=1pake−jwk∣2P_{xx}(e^{jw})=\sigma^2_p|H(e^{jw})|^2=\sigma^2_p\begin{vmatrix}\frac{1}{1+\displaystyle\sum^p_{k=1}a_ke^{-jwk}}\end{vmatrix}^2$