风险风险之深入分析协方差意义与算法

本文深入浅出地介绍了协方差的概念及其在统计学中的应用,包括如何通过协方差矩阵来描述多维数据间的相关性,并给出了具体的计算实例。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

协方差(Covariance),是在概率论和统计学中用于衡量两个变量的总体误差。而方差是协方差的一种特殊情况,即当两个变量是相同的情况。协方差分析是建立在方差分析和回归分析基础之上的一种统计分析方法。协方差是建立在方差分析与回归分析的基础之上的一种统计分析方法,好官方的解释,不太好理解。下面我们有通用的方式来解释。

我们先回忆一下期望、方差与标准查的应用。期望(均值)描述的是样本集合的中间点,它告诉我们的信息是很有限的,而标准差给我们描述的则是样本集合的各个样本点到均值的距离之平均。以这两个集合为例,[0,8,12,20]和[8,9,11,12],两个集合的均值都是10,但显然两个集合差别是很大的,计算两者的标准差,前者是8.3,后者是1.8,显然后者较为集中,故其标准差小一些,标准差描述的就是这种“散布度”。

我们注意到,标准差和方差是用来描述一维数据的,但现实生活我们常常遇到含有多维数据的数据集,比如统计某次考试中100个学生5科考试成绩。面对这样的数据集,我们计算出每一个学生的成绩的方差,但是我们不能知道多个学生之间的成绩之间的关系,此时,协方差就是用来度量两个随机变量关系的统计量,即两个不同参数之间的。

协方差的结果有什么意义呢?如果结果为正值,则说明两者是正相关的(从协方差可以引出“相关系数”的定义),结果为负值就说明负相关的,如果为0,也是就是统计上说的“相互独立”。

当协方差多了后,我们可以构建成协方差矩阵,但是协方差矩阵,计算的样本集中不同纬度之间的协方差,而不是不同样本之间的协方差。比如100个学生的5科的成绩,构成的矩阵,为5*100的矩阵,得到的是每个学生之间的关系。

我们进一步分析一下协方差相关的公式

协方差定义:

我们通过2个例子来说明一下这个公式,

例1:假定X,Y为列向量,他们可能出现的4中情况如下:,每个样本都是2维的,经过转化可以得到X集合与Y集合

那协方差矩阵的第i行,第j列的值公式为:

解释为:协方差矩阵中第i行,第j列的协方差值 = (第i列的所有元素 - 第i列的均值) * (第j列的所有元素 - 第j列的均值);

计算结果为:


我们计算的协方差矩阵为:

例2:求解以下的协方差



在次我引用一个网友写的matblab算法,请点击

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值