期望、方差、协方差及相关系数的基本运算

最新推荐文章于 2024-08-11 22:15:35 发布

转载最新推荐文章于 2024-08-11 22:15:35 发布 · 9.8k 阅读

·

0

·

文章标签：

#期望 #方差 #协方差 #相关系数 #基本运算

数学专栏收录该内容

53 篇文章

订阅专栏

本文介绍了概率统计中的核心概念：期望、方差、协方差及相关系数的定义与性质，并提供了这些概念的基本运算规则。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

这篇文章总结了概率统计中期望、方差、协方差和相关系数的定义、性质和基本运算规则。

期望

定义

设P(x)是一个离散概率分布函数，自变量的取值范围为{x1,x2,⋯,xn}。其期望被定义为：

E (x) = \sum k = 1 n x k P (x k)

设p(x)是一个连续概率密度函数。其期望为：

E (x) = \int + \infty - \infty x p (x) d x

性质

1、线性运算规则

期望服从线性性质（可以很容易从期望的定义公式中导出）。因此线性运算的期望等于期望的线性运算：

E (a x + b y + c) = a E (x) + b E (y) + c

这个性质可以推广到任意一般情况：

E (\sum k = 1 n a i x i + c) = \sum k = 1 n a i E (x i) + c

2、函数的期望

设f(x)为x的函数，则f(x)的期望为：

离散：

E (f (x)) = \sum k = 1 n f (x k) P (x k)

连续：

E (f (x)) = \int + \infty - \infty f (x) p (x) d x

一定要注意，函数的期望不等于期望的函数，即E(f(x))≠f(E(x))！。

3、乘积的期望

一般来说，乘积的期望不等于期望的乘积，除非变量相互独立。因此，如果x和y相互独立，则E(xy)=E(x)E(y)。

期望的运算构成了统计量的运算基础，因为方差、协方差等统计量本质上是一种特殊的期望。

方差

定义

方差是一种特殊的期望，被定义为：

V a r (x) = E ((x - E (x)) 2)

性质

1、展开表示

反复利用期望的线性性质，可以算出方差的另一种表示形式：

V a r (x) = = = = = E ((x - E (x)) 2) E (x 2 - 2 x E (x) + (E (x)) 2) E (x 2) - 2 E (x) E (x) + (E (x)) 2 E (x 2) - 2 (E (x)) 2 + (E (x)) 2 E (x 2) - (E (x)) 2

2、常数的方差

常数的方差为0，由方差的展开表示很容易推得。

3、线性组合的方差

方差不满足线性性质，两个变量的线性组合方差计算方法如下：

V a r (a x + b y) = a 2 V a r (x) + b 2 V a r (y) + 2 C o v (x, y)

其中Cov(x,y)为x和y的协方差，下一节讨论。

4、独立变量的方差

如果两个变量相互独立，则：

V a r (a x + b y) = a 2 V a r (x) + b 2 V a r (y)

作为推论，如果x和y相互独立：Var(x+y)=Var(x)+Var(y)。

协方差

定义

两个随机变量的协方差被定义为：

C o v (x, y) = E ((x - E (x)) (y - E (y)))

因此方差是一种特殊的协方差。当x=y时，Cov(x,y)=Var(x)=Var(y)。

性质

1、独立变量的协方差

独立变量的协方差为0，可以由协方差公式推导出。

2、线性组合的协方差

协方差最重要的性质如下：

C o v (\sum i = 1 m a i x i, \sum j = 1 n b j y j) = \sum i = 1 m \sum j = 1 n a i b j C o v (x i, y j)

很多协方差的计算都是反复利用这个性质，而且可以导出一些列重要结论。

作为一种特殊情况：

C o v (a + b x, c + d y) = b d C o v (x, y)

另外当x=y时，可以导出方差的一般线性组合求解公式：

V a r (\sum k = 1 n a i x i) = \sum i = 1 n \sum j = 1 n a i a j C o v (x i, x j)

相关系数

定义

相关系数通过方差和协方差定义。两个随机变量的相关系数被定义为：

C o r r (x, y) = C o v ( x , y ) V a r ( x ) V a r ( y ) - - - - - - - - - - - \sqrt

性质

1、有界性

相关系数的取值范围为-1到1，其可以看成是无量纲的协方差。

2、统计意义

值越接近1，说明两个变量正相关性（线性）越强，越接近-1，说明负相关性越强，当为0时表示两个变量没有相关性。

from: http://blog.codinglabs.org/articles/basic-statistics-calculate.html

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。