样本方差,协方差,协方差矩阵

本文深入探讨了样本方差与总体方差的关系,详细解释了样本方差公式及其推导过程。同时,介绍了协方差的概念,它是衡量两个随机变量线性相关程度的指标,并给出了样本协方差的计算公式。最后,文章讲解了协方差矩阵,用于描述多维随机变量之间的线性关系。

一、样本方差

设样本均值为$\bar x$,样本方差为S2,总体均值为${\rm{\mu }}$,总体方差为${{\rm{\sigma }}^2}$,那么样本方差

${S^2} = \frac{1}{{n - 1}}\mathop \sum \limits_{i = 1}^n {\left( {{x_i} - \bar x} \right)^2}$

推导:假设样本数量等于总体数量,应有

 ${S^2} = \frac{1}{n}\mathop \sum \limits_{i = 1}^n {\left( {{x_i} - \bar x} \right)^2}$

在多次重复抽取样本过程中,样本方差会逐渐接近总体方差,假设每次抽取的样本方差为

(S12,S22,S32…),然后对这些样本方差求平均值记为E(S2),则

 

${\rm{E}}\left( {{{\rm{S}}^2}} \right) = {\rm{E}}\left( {\frac{1}{n}\mathop \sum \limits_{i = 1}^n {{\left( {{x_i} - \bar x} \right)}^2}} \right)$

$ = {\rm{E}}\left( {\frac{1}{n}\mathop \sum \limits_{i = 1}^n {{\left( {\left( {{x_i} - \mu } \right) - \left( {\bar x - \mu } \right)} \right)}^2}} \right)$

因为

$\frac{1}{n}\mathop \sum \limits_{i = 1}^n \left( {{x_i} - \mu } \right) = \frac{1}{n}\mathop \sum \limits_{i = 1}^n {x_i} - \mu  = \bar x - \mu $

接上式

${\rm{E}}\left( {\frac{1}{n}\mathop \sum \limits_{i = 1}^n {{\left( {\left( {{x_i} - \mu } \right) - \left( {\bar x - \mu } \right)} \right)}^2}} \right) = {\rm{E}}\left( {\frac{1}{n}\mathop \sum \limits_{i = 1}^n {{\left( {{x_i} - \mu } \right)}^2} - \frac{1}{n}\mathop \sum \limits_{i = 1}^n 2({x_i} - \mu )\left( {\bar x - \mu } \right) + \frac{1}{n}\mathop \sum \limits_{i = 1}^n {{\left( {{x_i} - \mu } \right)}^2}} \right)$

$ = {\rm{E}}\left( {\frac{1}{n}\mathop \sum \limits_{i = 1}^n {{\left( {{x_i} - \mu } \right)}^2} - 2\left( {\bar x - \mu } \right)\left( {\bar x - \mu } \right) + {{\left( {\bar x - \mu } \right)}^2}} \right)$

$ = {\rm{\;E}}\left( {\frac{1}{n}\mathop \sum \limits_{i = 1}^n {{\left( {{x_i} - \mu } \right)}^2} - {{\left( {\bar x - \mu } \right)}^2}} \right)$

$ = {\rm{E}}\left( {\frac{1}{n}\mathop \sum \limits_{i = 1}^n {{\left( {{x_i} - \mu } \right)}^2}} \right) - E({\left( {\bar x - \mu } \right)^2}) \le {\sigma ^2}$

所以样本方差除以n会小于总体方差

${\rm{E}}\left( {\frac{1}{n}\mathop \sum \limits_{i = 1}^n {{\left( {{x_i} - \mu } \right)}^2}} \right) - E({\left( {\bar x - \mu } \right)^2}) = {\sigma ^2} - \frac{1}{n}{\sigma ^2} = \frac{{n - 1}}{n}{\sigma ^2}$

所以样本方差与总体方差差(n-1)/n倍。

 

二、协方差

协方差是对两个随机变量联合分布线性相关程度的一种度量。两个随机变量越线性相关,协方差越大,完全线性无关,协方差为零。

Cov(x,y) = E[(x-E(x))(y-E(y))]

特殊的当只存在一个变量x,x与自身的协方差等于方差,记作Var(x)

Cov(x,x) =Var(x)= E[(x-E(x))(x-E(x))]

样本协方差

对于多维随机变量Q(x1,x2,x3,…,xn),样本集合为xij=[x1j,x2j,…,xnj](j=1,2,…,m),m为样本数量,在a,b(a,b=1,2…n)两个维度内

${\rm{cov}}\left( {{{\rm{x}}_{\rm{a}}},{{\rm{x}}_{\rm{b}}}} \right) = \frac{{\mathop \sum \nolimits_{j = 1}^m \left( {{x_{aj}} - {{\bar x}_a}} \right)\left( {{x_{bj}} - {{\bar x}_b}} \right)}}{{m - 1}}$

 

三、协方差矩阵

对于多维随机变量Q(x1,x2,x3,…,xn)我们需要对任意两个变量(xi,xj)求线性关系,即需要对任意两个变量求协方差矩阵

Cov(xi,xj)= E[(xi-E(xi))(xj-E(xj))]

\[{\rm{cov}}\left( {{x_i},{x_j}} \right) = \left[ {\begin{array}{*{20}{c}}
{{\rm{cov}}\left( {{x_1},{x_1}} \right)}&{{\rm{cov}}\left( {{x_1},{x_2}} \right)}&{{\rm{cov}}\left( {{x_1},{x_3}} \right)}& \cdots &{{\rm{cov}}\left( {{x_1},{x_{\rm{n}}}} \right)}\\
{{\rm{cov}}\left( {{x_2},{x_1}} \right)}&{{\rm{cov}}\left( {{x_2},{x_2}} \right)}&{{\rm{cov}}\left( {{x_2},{x_3}} \right)}& \cdots &{{\rm{cov}}\left( {{x_2},{x_n}} \right)}\\
{{\rm{cov}}\left( {{x_3},{x_1}} \right)}&{{\rm{cov}}\left( {{x_3},{x_2}} \right)}&{{\rm{cov}}\left( {{x_3},{x_3}} \right)}& \cdots &{{\rm{cov}}\left( {{x_3},{x_n}} \right)}\\
\vdots & \vdots & \vdots & \ddots & \vdots \\
{{\rm{cov}}\left( {{x_m}{x_1}} \right)}&{{\rm{cov}}\left( {{x_m},{x_2}} \right)}&{{\rm{cov}}\left( {{x_m},{x_3}} \right)}& \cdots &{{\rm{cov}}\left( {{x_m},{x_n}} \right)}
\end{array}} \right]\]

 

【 结束 】

转载于:https://www.cnblogs.com/fujj/p/9720357.html

反转病态方差协方差矩阵是指将一个病态(ill-conditioned)的方差协方差矩阵进行反转的过程。病态方差协方差矩阵是指在计算中存在数值不稳定性或者条件数很大的矩阵。在某些情况下,这可能会导致计算误差或不可靠的结果。 为了反转病态方差协方差矩阵,可以使用主成分分析(PCA)的方法。主成分分析是一种常用的降维技术,可以将原始数据转换为一组线性无关的主成分,其中每个主成分都是原始数据的线性组合。通过PCA,可以得到一个新的协方差矩阵,该矩阵是对角矩阵,其中对角线上的元素反映了原始数据的方差。 通过反转病态方差协方差矩阵,可以减小计算误差并提高计算结果的可靠性。这对于一些特殊的应用场合,特别是在模式识别领域,当模式向量的维数过高时会影响识别系统的泛化性能,非常有用。然而,需要注意的是,反转病态方差协方差矩阵只是一种近似方法,其结果依赖于采样样本的数量和质量。因此,样本数量越多,样本在总体中的覆盖面越广,所得的反转病态方差协方差矩阵越可靠。\[1\]\[3\] #### 引用[.reference_title] - *1* *3* [协方差矩阵的详细说明](https://blog.youkuaiyun.com/facerec/article/details/1697362)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^koosearch_v1,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [详解协方差协方差矩阵](https://blog.youkuaiyun.com/ybdesire/article/details/6270328)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^koosearch_v1,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值