Convariance Matrix

协方差矩阵是描述随机变量对之间协方差的矩阵,其元素为各随机变量对的协方差。该矩阵是对称的,并且在随机变量相互独立时退化为对角矩阵。此外,协方差矩阵是半正定的,这意味着所有特征值都是非负的。该矩阵在统计和多元数据分析中扮演重要角色,用于衡量变量间的线性相关性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

协方差矩阵(Covariance Matrix)

协方差

定义:设 XXXYYY 为两个随机变量,XXXYYY 的协方差
Cov[X,Y]=σXY=E[(X−E[X])(Y−E[Y])]=E[XY]−E[X]E[Y] Cov[X,Y]=\sigma_{XY}=E[(X-E[X])(Y-E[Y])]=E[XY]-E[X]E[Y] Cov[X,Y]=σXY=E[(XE[X])(YE[Y])]=E[XY]E[X]E[Y]

协方差矩阵

定义:设 nnn 维随机变量 (X1,X2,...,Xn)(X_1,X_2,...,X_n)(X1,X2,...,Xn) 的第 iii 个分量 XiX_iXi 与第 jjj 个分量 XjX_jXj 的协方差为 σij\sigma_{ij}σij,则称矩阵
Σ=(σ11σ12…σ1nσ21σ22…σ2n⋮⋮⋮σn1σn2…σnn) \Sigma= \begin{pmatrix} \sigma_{11} & \sigma_{12} & \dots & \sigma_{1n} \\ \sigma_{21} & \sigma_{22} & \dots & \sigma_{2n} \\ \vdots & \vdots & & \vdots\\ \sigma_{n1} & \sigma_{n2} & \dots & \sigma_{nn} \\ \end{pmatrix} Σ=σ11σ21σn1σ12σ22σn2σ1nσ2nσnn
nnn 维随机变量 (X1,X2,...,Xn)(X_1,X_2,...,X_n)(X1,X2,...,Xn) 的协方差矩阵。

​ 设 Σ\SigmaΣnnn 维随机变量 (X1,X2,...,Xn)(X_1,X_2,...,X_n)(X1,X2,...,Xn) 的协方差矩阵,则有如下性质:

  • Σ\SigmaΣ 为半正定矩阵(Positive Semidefinite Matrix)。
  • ② 若随机变量 X1,X2,...,XnX_1,X_2,...,X_nX1,X2,...,Xn 相互独立,那么 Σ\SigmaΣ 为对角矩阵。

​ **证:**① 由协方差矩阵的定义知,Σ\SigmaΣ 为对称矩阵。
​ 对任意 x∈Rnx\in \mathbb{R}^nxRn
xTΣx=∑i=1n∑j=1n(σijxixj)=∑i=1n∑j=1n(E[(Xi−E[Xi])(Xj−E[Xj])]xixj)=E[∑i=1n∑j=1n(Xi−E[Xi])(Xj−E[Xj])xixj]=E[(∑i=1n(Xi−E[Xi])xi)2]⩾0 \begin{aligned} x^T\Sigma x&=\sum_{i=1}^n\sum_{j=1}^n(\sigma_{ij}x_ix_j)\\ &=\sum_{i=1}^n\sum_{j=1}^n\left(E[(X_i-E[X_i])(X_j-E[X_j])]x_ix_j\right) \\ &=E\left[\sum_{i=1}^n\sum_{j=1}^n(X_i-E[X_i])(X_j-E[X_j])x_ix_j\right] \\ &=E\left[\left(\sum_{i=1}^n(X_i-E[X_i])x_i\right)^2\right] \\ &\geqslant 0 \end{aligned} xTΣx=i=1nj=1n(σijxixj)=i=1nj=1n(E[(XiE[Xi])(XjE[Xj])]xixj)=E[i=1nj=1n(XiE[Xi])(XjE[Xj])xixj]=E(i=1n(XiE[Xi])xi)20
故,协方差矩阵 Σ\SigmaΣ 为半正定矩阵。

​ 设 nnn 维随机变量 $
X=\begin{bmatrix}
X_1\
X_2\
\vdots\
X_n\end{bmatrix}$,则 XXX 的协方差矩阵
Σ=E[(X−E[X])(X−E[X])T]=E[XXT]−E[X]E[XT] \Sigma=E[(X-E[X])(X-E[X])^T]=E[XX^T]-E[X]E[X^T] Σ=E[(XE[X])(XE[X])T]=E[XXT]E[X]E[XT]
证:
Σ=[Cov[X1,X1]Cov[X1,X2]⋯Cov[X1,Xn]Cov[X2,X1]Cov[X2,X2]⋯Cov[X2,Xn]⋮⋮⋮Cov[Xn,X1]Cov[Xn,X2]⋯Cov[Xn,Xn]]=[E[(X1−E[X1])(X1−E[X1])]E[(X1−E[X1])(X2−E[X2])]⋯E[(X1−E[X1])(Xn−E[Xn])]E[(X2−E[X2])(X1−E[X1])]E[(X2−E[X2])(X2−E[X2])]⋯E[(X2−E[X2])(Xn−E[Xn])]⋮⋮⋮E[(Xn−E[Xn])(X1−E[X1])]E[(Xn−E[Xn])(X2−E[X2])]⋯E[(Xn−E[Xn])(Xn−E[Xn])]]=E[(X1−E[X1])(X1−E[X1])(X1−E[X1])(X2−E[X2])⋯(X1−E[X1])(Xn−E[Xn])(X2−E[X2])(X1−E[X1])(X2−E[X2])(X2−E[X2])⋯(X2−E[X2])(Xn−E[Xn])⋮⋮⋮(Xn−E[Xn])(X1−E[X1])(Xn−E[Xn])(X2−E[X2])⋯(Xn−E[Xn])(Xn−E[Xn])]=E[[X1−E[X1]X2−E[X2]⋮Xn−E[Xn]][X1−E[X1]X2−E[X2]⋯Xn−E[Xn]]]=E[(X−E[X])(X−E[X])T]=E[(X−E[X])(XT−E[X]T)]=E[XXT−XE[X]T−E[X]XT+E[X]E[X]T]=E[XXT]−E[XE[X]T]−E[E[X]XT]+E[E[X]E[X]T]=E[XXT]−E[X]E[X]T−E[X]E[XT]+E[X]E[X]T=E[XXT]−E[X]E[XT] \begin{aligned} \Sigma&= \begin{bmatrix} Cov[X_1,X_1] & Cov[X_1,X_2] & \cdots & Cov[X_1,X_n] \\ Cov[X_2,X_1] & Cov[X_2,X_2] & \cdots & Cov[X_2,X_n] \\ \vdots & \vdots & & \vdots \\ Cov[X_n,X_1] & Cov[X_n,X_2] & \cdots & Cov[X_n,X_n] \\ \end{bmatrix} \\ \\ &=\begin{bmatrix} E[(X_1-E[X_1])(X_1-E[X_1])] & E[(X_1-E[X_1])(X_2-E[X_2])] & \cdots & E[(X_1-E[X_1])(X_n-E[X_n])] \\ E[(X_2-E[X_2])(X_1-E[X_1])] & E[(X_2-E[X_2])(X_2-E[X_2])] & \cdots & E[(X_2-E[X_2])(X_n-E[X_n])] \\ \vdots & \vdots & & \vdots \\ E[(X_n-E[X_n])(X_1-E[X_1])] & E[(X_n-E[X_n])(X_2-E[X_2])] & \cdots & E[(X_n-E[X_n])(X_n-E[X_n])] \\ \end{bmatrix} \\ \\ &=E\begin{bmatrix} (X_1-E[X_1])(X_1-E[X_1]) & (X_1-E[X_1])(X_2-E[X_2]) & \cdots & (X_1-E[X_1])(X_n-E[X_n]) \\ (X_2-E[X_2])(X_1-E[X_1]) & (X_2-E[X_2])(X_2-E[X_2]) & \cdots & (X_2-E[X_2])(X_n-E[X_n]) \\ \vdots & \vdots & & \vdots \\ (X_n-E[X_n])(X_1-E[X_1]) & (X_n-E[X_n])(X_2-E[X_2]) & \cdots & (X_n-E[X_n])(X_n-E[X_n]) \\ \end{bmatrix} \\ \\ &=E\begin{bmatrix} \begin{bmatrix} X_1-E[X_1]\\ X_2-E[X_2]\\ \vdots \\ X_n-E[X_n]\\ \end{bmatrix} \begin{bmatrix} X_1-E[X_1] & X_2-E[X_2] & \cdots & X_n-E[X_n]\\ \end{bmatrix} \end{bmatrix} \\ \\ &=E[(X-E[X])(X-E[X])^T] \\\\ &=E[(X-E[X])(X^T-E[X]^T)] \\\\ &=E[XX^T-XE[X]^T-E[X]X^T+E[X]E[X]^T] \\\\ &=E[XX^T]-E[XE[X]^T]-E[E[X]X^T]+E[E[X]E[X]^T] \\\\ &=E[XX^T]-E[X]E[X]^T-E[X]E[X^T]+E[X]E[X]^T \\\\ &=E[XX^T]-E[X]E[X^T] \\\\ \end{aligned} Σ=Cov[X1,X1]Cov[X2,X1]Cov[Xn,X1]Cov[X1,X2]Cov[X2,X2]Cov[Xn,X2]Cov[X1,Xn]Cov[X2,Xn]Cov[Xn,Xn]=E[(X1E[X1])(X1E[X1])]E[(X2E[X2])(X1E[X1])]E[(XnE[Xn])(X1E[X1])]E[(X1E[X1])(X2E[X2])]E[(X2E[X2])(X2E[X2])]E[(XnE[Xn])(X2E[X2])]E[(X1E[X1])(XnE[Xn])]E[(X2E[X2])(XnE[Xn])]E[(XnE[Xn])(XnE[Xn])]=E(X1E[X1])(X1E[X1])(X2E[X2])(X1E[X1])(XnE[Xn])(X1E[X1])(X1E[X1])(X2E[X2])(X2E[X2])(X2E[X2])(XnE[Xn])(X2E[X2])(X1E[X1])(XnE[Xn])(X2E[X2])(XnE[Xn])(XnE[Xn])(XnE[Xn])=EX1E[X1]X2E[X2]XnE[Xn][X1E[X1]X2E[X2]XnE[Xn]]=E[(XE[X])(XE[X])T]=E[(XE[X])(XTE[X]T)]=E[XXTXE[X]TE[X]XT+E[X]E[X]T]=E[XXT]E[XE[X]T]E[E[X]XT]+E[E[X]E[X]T]=E[XXT]E[X]E[X]TE[X]E[XT]+E[X]E[X]T=E[XXT]E[X]E[XT]

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值