协方差矩阵及其计算方法

观测矩阵

例:如果观测NNN个人的体重www和身高hhh,这样会形成R2R^2R2的样本空间,观测向量XjX_jXjXj⊆R2X_j\subseteq R^2XjR2)表示第jjj个人体重和身高,观测矩阵可以表示为:

[w1w1…wNh1h2…hN]\begin{bmatrix}w_1&w_1&\dots &w_N\\h_1&h_2&\dots &h_N \end{bmatrix}[w1h1w1h2wNhN]

其中:
X1=[w1h1]X_1=\begin{bmatrix}w_1\\h_1 \end{bmatrix}X1=[w1h1]X2=[w2h2]X_2=\begin{bmatrix}w_2\\h_2 \end{bmatrix}X2=[w2h2]XN=[wNhN]X_N=\begin{bmatrix}w_N\\h_N \end{bmatrix}XN=[wNhN],这些为观测向量

均值和协方差

假设[X1X2…XN][X_1\quad X_2\quad \dots \quad X_N][X1X2XN]p×Np\times Np×N的观测矩阵,观测向量X1X_1X1X2X_2X2XNX_NXN的样本均值MMM为:

M=1N(X1+X2+⋯+XN)M=\dfrac{1}{N}(X_1+X_2+\dots +X_N)M=N1(X1+X2++XN)

如果将原观测测向量画成散列图(scatter),那么样本均值MMM就是散列图中数据的中心。

X^k=Xk−M\hat{X}_{k}=X_k-MX^k=XkMk=1,2,…,Nk=1,2,\dots ,Nk=1,2,,N

则构成新的矩阵B=[X^1X^2…X^N]B=[\hat{X}_{1}\quad \hat{X}_{2}\quad \dots \quad \hat{X}_{N}]B=[X^1X^2X^N],此矩阵BBB称为平均偏差形式,且具有零样本均值。矩阵BBB的散列图的中心在坐标原点。

协方差矩阵(covariance matrix):协方差矩阵是一个p×pp\times pp×p的矩阵SSS,且满足:S=1N−1BBTS=\dfrac{1}{N-1}BB^TS=N11BBT

由于任何具有BBTBB^TBBT的矩阵都是半正定的(如果BBBm×nm\times nm×n的矩阵,那么BBTBB^TBBT是半正定的),所以SSS也是半正定的。

注:协方差矩阵也常记作Σ\SigmaΣ

:从一个总体中随机抽取4个样本做3次测量,每个样本的观测向量为:
X1=[121]X_1=\begin{bmatrix}1\\2\\1 \end{bmatrix}X1=121X2=[4213]X_2=\begin{bmatrix}4\\2\\13 \end{bmatrix}X2=4213X3=[781]X_3=\begin{bmatrix}7\\8\\1 \end{bmatrix}X3=781X4=[845]X_4=\begin{bmatrix}8\\4\\5 \end{bmatrix}X4=845
求样本均值及协方差矩阵。

解:

样本均值:

M=14([121]+[4213]+[781]+[845])=14[201620]=[545]M=\dfrac{1}{4}(\begin{bmatrix}1\\2\\1 \end{bmatrix}+\begin{bmatrix}4\\2\\13 \end{bmatrix}+\begin{bmatrix}7\\8\\1 \end{bmatrix}+\begin{bmatrix}8\\4\\5 \end{bmatrix})=\dfrac{1}{4}\begin{bmatrix}20\\16\\20 \end{bmatrix}=\begin{bmatrix}5\\4\\5 \end{bmatrix}M=41(121+4213+781+845)=41201620=545

X1X_1X1X2X_2X2XNX_NXN中减去样本均值MMM得:

X1^=[−4−2−4]\hat{X_1}=\begin{bmatrix}-4\\-2\\-4 \end{bmatrix}X1^=424X2^=[−1−28]\hat{X_2}=\begin{bmatrix}-1\\-2\\8 \end{bmatrix}X2^=128X3^=[24−4]\hat{X_3}=\begin{bmatrix}2\\4\\-4 \end{bmatrix}X3^=244X4^=[300]\hat{X_4}=\begin{bmatrix}3\\0\\0 \end{bmatrix}X4^=300

所以得到BBB矩阵:

B=[−4−123−2−240−48−40]B=\begin{bmatrix}-4&-1&2&3\\-2&-2&4&0\\-4&8&-4&0 \end{bmatrix}B=424128244300

矩阵BBB为原样本经过居中处理后的样本。

所以,样本的协方差矩阵SSS为:

S=1N−1BBT=14−1[−4−123−2−240−48−40][−4−2−4−1−2824−4300]=13[301801824−240−2496]=[106068−80−832]S=\dfrac{1}{N-1}BB^T=\dfrac{1}{4-1}\begin{bmatrix}-4&-1&2&3\\-2&-2&4&0\\-4&8&-4&0 \end{bmatrix}\begin{bmatrix}-4&-2&-4\\-1&-2&8\\2&4&-4\\3&0&0 \end{bmatrix}=\dfrac{1}{3}\begin{bmatrix}30&18&0\\18&24&-24\\0&-24&96 \end{bmatrix}=\begin{bmatrix}10&6&0\\6&8&-8\\0&-8&32 \end{bmatrix}S=N11BBT=411424128244300412322404840=313018018242402496=10606880832

x1,x2,…,xpx_1,x_2,\dots,x_px1,x2,,xp表示XXX的坐标,例如x1x_1x1X1,X2,…,XNX_1,X_2,\dots,X_NX1,X2,,XN集合中变化的第一个坐标的数值。对j=1,2,…,pj=1,2,\dots,pj=1,2,,p(本例中p=3p=3p=3N=4N=4N=4),矩阵SSS的对角线元素sjjs_{jj}sjj就是xjx_jxj的方差,xjx_jxj的方差用于度量xjx_jxj值的分散性。
所以本例中,x1x_1x1方差为10,x2x_2x2方差为8,x3x_3x3方差为32。
x3x_3x3方差为32,大于x1x_1x1方差10,这表明对应向量中第三个元素的集合包含比第一个元素的集合更大的取值范围。

数据的总方差是矩阵SSS对角线上方差的和,也就是SSS的迹(trace)tr(S)tr(S)tr(S)

矩阵SSS中的元素sij(i≠j)s_{ij}(i\ne j)sij(i=j)称为xix_ixixjx_jxj协方差

协方差就是不同维度的数据(减去平均值后,即居中处理后)的点积,再乘以1N−1\dfrac{1}{N-1}N11
x1x_1x1x2x_2x2x3x_3x3在本例中是4个样本的三个维度,即x1=[−4−123]x_1=[-4\quad -1 \quad 2 \quad 3]x1=[4123]x2=[−2−240]x_2=[-2\quad -2 \quad 4 \quad 0]x2=[2240]x3=[−48−40]x_3=[-4\quad 8 \quad -4 \quad 0]x3=[4840]

本例中,x1x_1x1x3x_3x3之间的协方差是0,这是因为s13=0s_{13}=0s13=0,这种情况在统计学上被称为:x1x_1x1x3x_3x3是无关的。

如果大部分或者所有变量x1x_1x1x2x_2x2…、xpx_pxp是无关的,即当X1,X2,…,XNX_1,X_2,\dots,X_NX1,X2,,XN的协方差矩阵是对角阵或几乎是对角阵时,X1,X2,…,XNX_1,X_2,\dots,X_NX1,X2,,XN中多变量的数据的分析可以简化。

<think>好的,我现在需要帮用户找到协方差矩阵的计公式及其推导过程。首先,我得回忆一下协方差矩阵的定义和相关知识。根据用户提供的引用,协方差矩阵是描述多个随机变量之间协方差的矩阵,尤其是对角线上的元素是各个变量的方差,非对角线则是变量之间的协方差。 用户提到的引用[1]和[4]都涉及协方差矩阵的定义和计。比如引用[4]详细说明了三维点云的协方差矩阵结构,并给出了Cov(X,Y)的计步骤。这可能是一个关键点。另外,引用[2]也解释了协方差矩阵的结构,特别是n×n的矩阵形式,其中n是变量的数量。 首先,我需要明确协方差矩阵的计公式。对于样本矩阵X,假设有m个样本,每个样本有n个特征,那么协方差矩阵C是一个n×n的矩阵,其中每个元素C_ij表示第i个和第j个特征之间的协方差。根据协方差的定义,Cov(X_i, X_j) = E[(X_i - μ_i)(X_j - μ_j)^T],其中μ是均值。不过在实际计中,通常使用样本协方差,分母可能是m-1而不是m,但用户提供的引用中用的是除以N,也就是样本数,这可能是因为引用中的例子使用的是总体协方差而不是样本协方差。 接下来,推导过程。根据引用[4],以Cov(X,Y)为例,推导了协方差的计步骤,即协方差等于乘积的期望减去期望的乘积。这个可能需要详细展开,比如E[XY] - E[X]E[Y]。不过用户给出的推导中,似乎是从展开式开始的,即E[(X - E[X])(Y - E[Y])],然后展开成E[XY - E[X]Y - XE[Y] + E[X]E[Y]],再逐项计得到E[XY] - E[X]E[Y]。 然后,协方差矩阵的构建。对于一个n维随机向量,协方差矩阵的每个元素C_ij对应第i和第j维的协方差。所以整个矩阵的结构就是将这些协方差按位置排列。例如,三维情况下的矩阵结构如引用[4]所示。 用户可能需要具体的公式和例子。比如,如何从数据矩阵计协方差矩阵。假设数据矩阵是n×m,其中n是变量数,m是样本数,那么协方差矩阵的计通常涉及中心化数据(每个变量减去均值),然后计乘积的均值。或者,用矩阵运表示为(1/(m-1)) * X_centered * X_centered^T,其中X_centered是去均值后的数据矩阵。 需要注意的是,用户提供的引用中有不同的表示方式,比如引用[4]中的分母是N,而有些情况下样本协方差分母是N-1。这里可能需要指出两者的区别,但根据引用中的内容,用户的问题可能更关注总体协方差的计,所以采用N作为分母。 总结步骤应该是:先计每个变量的均值,然后中心化数据,接着计每对变量的协方差,填充到矩阵对应位置。最后形成的矩阵就是协方差矩阵。 另外,用户可能需要数学表达式,根据系统指令,行内公式用$...$,独立公式用$$...$$。例如,协方差的公式可以写成$Cov(X,Y) = \frac{1}{N}\sum_{i=1}^N (X_i - \bar{X})(Y_i - \bar{Y})$,而协方差矩阵则可以表示为一个大矩阵,用双美元符号包围。 在推导过程中,可能需要用到期望的线性性质,比如E[aX + bY] = aE[X] + bE[Y],以及如何处理协方差的展开。这部分需要详细但清晰的步骤,避免过于简略让用户难以理解。 最后,生成相关问题的时候,需要考虑协方差矩阵的应用场景、与其他矩阵(如相关矩阵)的区别、计算方法的时间复杂度,或者在不同领域如PCA、卡尔曼滤波中的具体应用,如引用中提到的卡尔曼滤波中的协方差矩阵更新步骤。</think>### 协方差矩阵的计公式及推导过程 #### 1. **定义与公式** 协方差矩阵是描述多个随机变量之间协方差关系的**对称矩阵**。对于包含$n$个随机变量的向量$\mathbf{X} = (X_1,X_2,...,X_n)^T$,其协方差矩阵$C$的元素$C_{ij}$定义为: $$C_{ij} = \text{Cov}(X_i, X_j) = E\left[(X_i - E[X_i])(X_j - E[X_j])\right]$$ 其中$E[\cdot]$表示数学期望。协方差矩阵的完整形式为: $$ C = \begin{bmatrix} \text{Cov}(X_1,X_1) & \text{Cov}(X_1,X_2) & \cdots & \text{Cov}(X_1,X_n) \\ \text{Cov}(X_2,X_1) & \text{Cov}(X_2,X_2) & \cdots & \text{Cov}(X_2,X_n) \\ \vdots & \vdots & \ddots & \vdots \\ \text{Cov}(X_n,X_1) & \text{Cov}(X_n,X_2) & \cdots & \text{Cov}(X_n,X_n) \end{bmatrix} $$ #### 2. **推导过程** 以二维变量$(X,Y)$为例,推导协方差矩阵元素$\text{Cov}(X,Y)$的计: 1. **均值计**: $$\bar{X} = \frac{1}{N}\sum_{i=1}^N X_i, \quad \bar{Y} = \frac{1}{N}\sum_{i=1}^N Y_i$$ 2. **协方差展开**: $$\text{Cov}(X,Y) = \frac{1}{N}\sum_{i=1}^N (X_i - \bar{X})(Y_i - \bar{Y})$$ 展开乘积项: $$ \begin{align*} \text{Cov}(X,Y) &= E[(X - E[X])(Y - E[Y])] \\ &= E[XY - XE[Y] - YE[X] + E[X]E[Y]] \\ &= E[XY] - E[X]E[Y] \end{align*} $$ 其中$E[XY]$是$X$和$Y$的联合期望[^4]。 #### 3. **矩阵形式计** 对于样本矩阵$X$(维度$n \times m$,$n$为变量数,$m$为样本数): 1. **中心化矩阵**: 每列减去对应变量的均值,得到$X_{\text{centered}}$。 2. **协方差矩阵公式**: $$C = \frac{1}{m-1} X_{\text{centered}} X_{\text{centered}}^T \quad (\text{样本协方差})$$ 或 $$C = \frac{1}{m} X_{\text{centered}} X_{\text{centered}}^T \quad (\text{总体协方差})$$ 矩阵乘法直接生成$n \times n$的对称矩阵[^1][^4]。 #### 4. **示例** 假设三维变量$\mathbf{X}=(X,Y,Z)$,其协方差矩阵为: $$ C = \begin{bmatrix} \text{Cov}(X,X) & \text{Cov}(X,Y) & \text{Cov}(X,Z) \\ \text{Cov}(Y,X) & \text{Cov}(Y,Y) & \text{Cov}(Y,Z) \\ \text{Cov}(Z,X) & \text{Cov}(Z,Y) & \text{Cov}(Z,Z) \end{bmatrix} $$ 对角线元素为各变量的方差$\text{Var}(X)$,非对角线为协方差[^2][^4]。 --- ### 相关问题 1. **协方差矩阵在PCA中如何应用?** PCA通过协方差矩阵的特征值分解实现降维,最大特征值对应的特征向量为主成分[^2][^4]。 2. **协方差矩阵与相关矩阵有何区别?** 协方差矩阵保留量纲,相关矩阵通过标准化消除量纲影响。 3. **卡尔曼滤波中协方差矩阵如何更新?** 通过先验误差协方差矩阵$P_k^-$和卡尔曼增益$K_k$迭代更新协方差矩阵$P_k$[^3]。 [^1]: 协方差矩阵的定义及其公式 [^2]: PCA原理推导中的协方差矩阵解析 [^3]: 卡尔曼滤波的协方差更新公式 : PCA主成分分析的协方差推导
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值