04概率论与数理统计笔记随机变量的数字特征——基于《概率论与数理统计》许忠好

原创已于 2025-10-12 16:54:50 修改 · 648 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#数据结构 #算法 #矩阵

于 2021-11-22 15:28:52 首次发布

概率论与数理统计专栏收录该内容

7 篇文章

订阅专栏

本文详细介绍了概率论中的数学期望概念，包括离散和连续随机变量的期望计算，以及性质和定理。接着讨论了方差的定义、性质和协方差、相关系数的概念。最后，阐述了中心极限定理、大数定律等重要极限定理在概率统计中的应用。这些理论是理解和应用统计学的基础。

1 数学期望

一维变量

离散随机变量X具有分布列
$P(X = x_k) = p_k,k = 1,2,3……$
若级数
$∑k=1∞xkpk绝对收敛，即∑k=1∞∣xk∣pk<∞\sum^∞_{k=1}x_kp_k 绝对收敛，即\sum^∞_{k=1}|x_k|p_k <∞$
该级数就是X的数学期望
记为EX

连续型随机变量X有概率密度函数p(x)
$∫−∞∞xp(x)dx收敛\int^∞_{-∞}xp(x)dx收敛$
于是上面的积分就是X的数学期望

注意：初等概率论数学期望EX都是有限制，不包括∞的情况，而有些分布数学期望不存在，比如柯西分布

定理
Y = f(X) 为随机变量X的函数，若数学期望E(f(X))
$E(f(X))=\left\{ \begin{aligned} \sum_{k}f(x_k)p_k& &离散 \\ \int^∞_{-∞} f(x)p(x)dx & & 连续\\ \end{aligned} \right.$

性质
1)E( c ) = c
2)E(aX) = aEX
3)E(f(X)+g(X)) = E(f(X)) + E(g(X))

二维

定义
（X，Y）是二维随机变量，(EX,EY)是该变量的数学期望向量

定理
Z=g(X,Y)是二维随机变量的函数
$Eg(X,Y)\left\{ \begin{aligned} \sum_{i,j}g(x_i,y_i)p_{ij}& &离散 \\ \iint g(x,y)p(x,y)dxdy & & 连续\\ \end{aligned} \right.$

定理
1） $E (f (X) + g (Y)) = E f (X) + E g (Y)$ 其中f和g为一元实值函数
2）X,Y相互独立，则 $E (f (X) g (Y)) = E f (X) E g (Y)$

于是我们有
$E [(X - EX) (Y - E Y)] = E (X Y) - EXE Y$
XY相互独立 $E (f (X) g (Y)) = 0$

2.方差

若数学期望 $E(X-EX)^2$ 存在称其为随机变量X的方差，记为VarX
称 $σX=σ(X)=VarX\sigma_X=\sigma(X) = \sqrt{VarX}$ 是X的标准差

性质
1）Var( c ) = 0
2) Var(aX+b) = $a^2$ Var(X)
3) VarX = $EX^2 - (EX)^2$
4) VarX $⩾\geqslant$ 0
5) Var(X±Y) = VarX + VarY ± $2 E [(X - EX) (Y - E Y)]$
6) XY相互独立， Var(X±Y)=VarX+VarY

马尔科夫不等式
随机变量X方差存在，对任意 $ϵ\epsilon$ >0
$P(X≥ϵ)≤EXϵP(X≥\epsilon)≤\frac{EX}{\epsilon}$

切比雪夫不等式
$P{∣X−EX∣≥ϵ}≤VarXϵ2P\{|X-EX|≥\epsilon\}≤\frac{VarX}{\epsilon^2}$ $P{∣X−EX∣<ϵ}≥1−VarXϵ2P\{|X-EX|<\epsilon\}≥1-\frac{VarX}{\epsilon^2}$

3.协方差与相关系数

定义
设（X,Y)是二维随机变量，若 $E [(X - EX) (Y - E Y)]$ 存在称之为X和Y的协方差，记为Cov(X,Y)

性质
1) $C o v (X, Y) = C o v (Y, X)$ $Cov(X,X)=VarX\ \ \ Cov(X,X) = VarX$
2) $Cov(aX,bY)=abCov(X,Y)Cov(X,a)=0\ \ \ Cov(aX,bY)=abCov(X,Y)$
3) $C o v (X, Y) = E (X Y) - EXE Y$
4）X和Y相互独立，有Cov(X,Y) = 0 (反之不一定成立
5）Cov(X+Y,Z) = Cov(X,Z） + Cov(Y,Z)
6) Var(X±Y) = VarX+VarY +=2Cov(X,Y)

定义
$Corr(X,Y)=Cov(X,Y)VarXVarYCorr(X,Y)=\frac{Cov(X,Y)}{\sqrt{VarX}\sqrt{VarY}}$
是X和Y的相关系数，可记 $ρXY\rho_{XY}$
取值在-1到1之间
$EX∗=EY∗=0VarX∗=VarY∗=1X^{*} = \frac{X-EX}{\sqrt{VarX}}\quad Y^{*} = \frac{Y-EY}{\sqrt{VarY}}\\ \\\ \\ EX^*=EY^* = 0\\ VarX^* = VarY^* = 1$

定理
|Corr(X,Y)|≤1
==1的时候当且仅当X与Y有线性关系
即存在a,b使得P（Y=aX+b） ==1

推论
Cauchy-Schwarz不等式
$∣ C orr (X, Y) ∣ \leq 1$
得到 $∣E((X−EX)(Y−EY))∣2≤VarX⋅VarY|E((X-EX)(Y-EY))|^2≤VarX\cdot VarY$
一般期望存在，有
$E(XY)|^2≤EX^2EY^2$

对于(X,Y)~N【注意要联合分布】
Corr(X,Y) = $ρ\rho$ 对于二维正态分布，不相关和独立等价

4 矩和其他数字特征

矩
$E(X-EX)^k$ 是X的k阶中心矩，记为 $νk\nu_k$
$EX^k$ 是X的原点矩 记为 $μk\mu_k$

偏度系数
X的三阶矩 $μ3\mu_3$ 存在，称 $βS=ν3σ3\beta_S = \frac{\nu_3}{\sigma^3}$ 是X的偏度系数
$σ=ν2\sigma = \sqrt{\nu_2}$ 是X的标准差

峰度系数
随机变量X的四阶矩 $μ4\mu_4$ 存在
$βk=ν4ν22−3\beta_k=\frac{\nu_4}{\nu_2^2}-3$ 是X的峰度系数

变异系数
随机变量二阶矩 $μ2\mu_2$ 存在且数学期望 $μ1=EX≠0\mu_1=EX≠0$ ，称
$Cv=ν2μ1=1αC_v=\frac{\sqrt{\nu_2}}{\mu_1}=\frac{1}{\sqrt{\alpha}}$

分位数
F是X的分布函数，α∈（0，1）
$xα=inf{x:F(x)≥α}x_{\alpha}=inf\{x:F(x)≥\alpha \}$ (下分位数点）

中位数
F是X的分布函数， $x_{1/2}$ 是X或F的中位数
P＜中位数的部分 = P > 中位数的部分

5 极限定理

中心极限定理

随机变量X服从二项分布 b(n,p)
当n充分大
可以用 N(np,np(1-p)) 来近似求解

若n趋于无穷， $Sn=∑k=1nXkS_n = \sum^n_{k=1}X_k$ 渐进服从正态分布，即
$Sn−ESnVarSn\frac{S_n-ES_n}{\sqrt{VarS_n}}$ 的分布函数 $Fn(x)收敛于Φ(x)F_n(x)收敛于\Phi(x)$
我们称 ${X_n,n≥1\}$ 服从中心极限定理

林德贝格——勒维中心定理
独立同分布的随机变量序列，数学期望为 $μ\mu$ 方差是 $σ2\sigma^2$ 记
则
$lim⁡n→∞P{Sn−nμσn≤y}=Φ(x)\lim_{n\rightarrow∞}P\{\frac{S_n-n\mu}{\sigma\sqrt{n}}≤y\} = \Phi(x)$