协方差与相关系数
X,YX,YX,Y 的协方差:
Cov(X,Y)=E[(X−E(X))(Y−E(Y))]=E(XY−XE(Y)−YE(X)+E(X)E(Y))=E(XY)−E(X)E(Y)−E(X)E(Y)+E(X)E(Y)=E(XY)−E(X)E(Y)\begin{align*} \text{Cov}(X,Y) &= E\left[(X-E(X))(Y-E(Y))\right]\\ &=E(XY-XE(Y)-YE(X)+E(X)E(Y))\\ &=E(XY)-E(X)E(Y)-E(X)E(Y)+E(X)E(Y)\\ &=E(XY)-E(X)E(Y) \end{align*}Cov(X,Y)=E[(X−E(X))(Y−E(Y))]=E(XY−XE(Y)−YE(X)+E(X)E(Y))=E(XY)−E(X)E(Y)−E(X)E(Y)+E(X)E(Y)=E(XY)−E(X)E(Y)
所以有 Cov(X,Y)=E(XY)−E(X)E(Y)\text{Cov}(X,Y)=E(XY)-E(X)E(Y)Cov(X,Y)=E(XY)−E(X)E(Y)
且 D(X±Y)=D(X)+D(Y)±2Cov(X,Y)D(X\pm Y)=D(X)+D(Y)\pm2\text{Cov}(X,Y)D(X±Y)=D(X)+D(Y)±2Cov(X,Y)
为了防止 Cov(X,Y)\text{Cov}(X,Y)Cov(X,Y) 受到单位的影响,做如下标准化操作:
X∗=X−E(X)D(X), Y∗=Y−E(Y)D(Y) X^*=\frac{X-E(X)}{\sqrt{D(X)}}, \ \ \ Y^*=\frac{Y-E(Y)}{\sqrt{D(Y)}} X∗=D(X)X−E(X), Y∗=D(Y)Y−E(Y)
那么有:
Cov(X∗,Y∗)=E(X∗Y∗)−E(X∗)E(Y∗)=E[X−E(X)D(X)⋅Y−E(Y)D(Y)]−E(X−E(X)D(X))E(Y−E(Y)D(Y))=E[(X−E(X))(Y−E(Y))]D(X)D(Y)=Cov(X,Y)D(X)D(Y)=ρ \begin{align*} \text{Cov}(X^*,Y^*)&=E(X^*Y^*)-E(X^*)E(Y^*)\\ &=E\left[\frac{X-E(X)}{\sqrt{D(X)}}\cdot\frac{Y-E(Y)}{\sqrt{D(Y)}}\right]-E\left(\frac{X-E(X)}{\sqrt{D(X)}}\right)E\left(\frac{Y-E(Y)}{\sqrt{D(Y)}}\right)\\ &=\frac{E[(X-E(X))(Y-E(Y))]}{\sqrt{D(X)}\sqrt{D(Y)}}\\ &=\frac{\text{Cov}(X,Y)}{\sqrt{D(X)}\sqrt{D(Y)}}\\ &=\rho \end{align*} Cov(X∗,Y∗)=E(X∗Y∗)−E(X∗)E(Y∗)=E[D(X)X−E(X)⋅D(Y)Y−E(Y)]−E(D(X)X−E(X))E(D(Y)Y−E(Y))=D(X)D(Y)E[(X−E(X))(Y−E(Y))]=D(X)D(Y)Cov(X,Y)=ρ
其中 ρ\rhoρ 被称为相关系数,它的作用是衡量两个随机变量之间的线性关系
引理:[E(XY)]2⩽E(X)2E(Y)2[E(XY)]^2\leqslant E(X)^2E(Y)^2[E(XY)]2⩽E(X)2E(Y)2
证明:
取函数 g(t)g(t)g(t) 有:
g(t)=E[(tX−Y)2]=E(t2X2−2tXY+Y2)=t2E(X2)−2tE(XY)+E(Y2)⩾0⇒Δ=4E(XY)2−4E(X2)E(Y2)⩽0 \begin{align*} g(t) &= E[(tX-Y)^2]\\ &=E(t^2X^2-2tXY+Y^2)\\ &=t^2E(X^2)-2tE(XY)+E(Y^2)\\ &\geqslant 0\\ \Rightarrow \Delta &= 4E(XY)^2-4E(X^2)E(Y^2)\\ &\leqslant 0\\ \end{align*} g(t)⇒Δ=E[(tX−Y)2]=E(t2X2−2tXY+Y2)=t2E(X2)−2tE(XY)+E(Y2)⩾0=4E(XY)2−4E(X2)E(Y2)⩽0
从而:
⇒[E(XY)]2⩽E(X)2E(Y)2 \Rightarrow [E(XY)]^2\leqslant E(X)^2E(Y)^2 ⇒[E(XY)]2⩽E(X)2E(Y)2
定理:相关系数有性质 ρ2⩽1\rho^2 \leqslant 1ρ2⩽1
证明:
令 X1=X−E(X),Y1=Y−E(Y)X_1=X-E(X), Y_1=Y-E(Y)X1=X−E(X),Y1=Y−E(Y),于是:
ρ2=(E[(X−E(X))(Y−E(Y))])2D(X)D(Y)=[E(X1X2)]2E(X1)2E(X2)2⩽E(X1)2E(X2)2E(X1)2E(X2)2=1 \begin{align*} \rho^2 &= \frac{\left(E\left[(X-E(X))(Y-E(Y))\right]\right)^2}{D(X)D(Y)}\\ &=\frac{[E(X_1X_2)]^2}{E(X_1)^2E(X_2)^2} \\ &\leqslant\frac{E(X_1)^2E(X_2)^2}{E(X_1)^2E(X_2)^2}\\ &=1 \end{align*} ρ2=D(X)D(Y)(E[(X−E(X))(Y−E(Y))])2=E(X1)2E(X2)2[E(X1X2)]2⩽E(X1)2E(X2)2E(X1)2E(X2)2=1
定理:
∣ρ=1∣⇔X|\rho = 1| \Leftrightarrow X∣ρ=1∣⇔X 与 YYY 以 P=1P=1P=1 成线性关系;即 P(Y=aX+b)=1P(Y=aX+b)=1P(Y=aX+b)=1
1、ρ=1\rho=1ρ=1,X,YX,YX,Y 完全正相关
2、ρ=−1\rho=-1ρ=−1,X,YX,YX,Y 完全负相关
3、∣ρ∣|\rho|∣ρ∣ 接近 000,X,YX,YX,Y 线性关系很弱
4、ρ=0\rho = 0ρ=0,则 X,YX,YX,Y 不存在线性关系
*注意:X,YX,YX,Y不相关,是指X,YX,YX,Y没有线性关系;而 X,YX,YX,Y 独立,是指 X,YX,YX,Y 没有任何关系
定理:X,YX,YX,Y 独立,则 X,YX,YX,Y 不相关
证明:
∵X,Y独立 E(XY)=E(X)E(Y)ρ=E(XY)−E(X)E(Y)D(X)D(Y)=0∴X,Y不相关 \begin{align*} &\because X,Y独立 \ \ \ \ \ E(XY) = E(X)E(Y)\\ &\rho=\frac{E(XY)-E(X)E(Y)}{\sqrt{D(X)}\sqrt{D(Y)}}=0 \\ &\therefore X,Y 不相关 \end{align*} ∵X,Y独立 E(XY)=E(X)E(Y)ρ=D(X)D(Y)E(XY)−E(X)E(Y)=0∴X,Y不相关
定理:X,YX,YX,Y 不相关,X,YX,YX,Y 不一定独立
中心矩和原点矩
原点矩:E(Xk)E(X^k)E(Xk)
期望 E(X)E(X)E(X) 为一阶原点矩
中心矩:E[(X−E(X))k]E[(X-E(X))^k]E[(X−E(X))k]
一阶中心矩:E(X−E(X))=E(X)−E(X)=0E(X-E(X))=E(X)-E(X)=0E(X−E(X))=E(X)−E(X)=0
二阶中心矩:E[(X−E(X))2]E[(X-E(X))^2]E[(X−E(X))2] 即为方差
9万+

被折叠的 条评论
为什么被折叠?



