04概率论与数理统计笔记 随机变量的数字特征——基于《概率论与数理统计》许忠好

本文详细介绍了概率论中的数学期望概念,包括离散和连续随机变量的期望计算,以及性质和定理。接着讨论了方差的定义、性质和协方差、相关系数的概念。最后,阐述了中心极限定理、大数定律等重要极限定理在概率统计中的应用。这些理论是理解和应用统计学的基础。

1 数学期望

一维变量

离散随机变量X具有分布列
P(X=xk)=pk,k=1,2,3……P(X = x_k) = p_k,k = 1,2,3……P(X=xk)=pk,k=1,2,3……
若级数
∑k=1∞xkpk绝对收敛,即∑k=1∞∣xk∣pk<∞\sum^∞_{k=1}x_kp_k 绝对收敛,即\sum^∞_{k=1}|x_k|p_k <∞ k=1xkpk绝对收敛,即k=1xkpk<
该级数就是X的数学期望
记为EX

连续型随机变量X有概率密度函数p(x)
∫−∞∞xp(x)dx收敛\int^∞_{-∞}xp(x)dx收敛xp(x)dx收敛
于是上面的积分就是X的数学期望

注意:初等概率论数学期望EX都是有限制,不包括∞的情况,而有些分布数学期望不存在,比如柯西分布

定理
Y = f(X) 为随机变量X的函数,若数学期望E(f(X))
EY=E(f(X))={∑kf(xk)pk离散∫−∞∞f(x)p(x)dx连续EY = E(f(X))=\left\{ \begin{aligned} \sum_{k}f(x_k)p_k& &离散 \\ \int^∞_{-∞} f(x)p(x)dx & & 连续\\ \end{aligned} \right.EY=E(f(X))=kf(xk)pkf(x)p(x)dx离散连续

性质
1)E( c ) = c
2)E(aX) = aEX
3)E(f(X)+g(X)) = E(f(X)) + E(g(X))

二维

定义
(X,Y)是二维随机变量,(EX,EY)是该变量的数学期望向量

定理
Z=g(X,Y)是二维随机变量的函数
EZ=Eg(X,Y){∑i,jg(xi,yi)pij离散∬g(x,y)p(x,y)dxdy连续EZ = Eg(X,Y)\left\{ \begin{aligned} \sum_{i,j}g(x_i,y_i)p_{ij}& &离散 \\ \iint g(x,y)p(x,y)dxdy & & 连续\\ \end{aligned} \right.EZ=Eg(X,Y)i,jg(xi,yi)pijg(x,y)p(x,y)dxdy离散连续

定理
1)E(f(X)+g(Y))=Ef(X)+Eg(Y)E(f(X) + g(Y)) = Ef(X)+Eg(Y)E(f(X)+g(Y))=Ef(X)+Eg(Y) 其中f和g为一元实值函数
2)X,Y相互独立,则E(f(X)g(Y))=Ef(X)Eg(Y)E(f(X)g(Y))=Ef(X)Eg(Y)E(f(X)g(Y))=Ef(X)Eg(Y)

于是我们有
E[(X−EX)(Y−EY)]=E(XY)−EXEYE[(X-EX)(Y-EY)]=E(XY)-EXEYE[(XEX)(YEY)]=E(XY)EXEY
XY相互独立E(f(X)g(Y))=0E(f(X)g(Y))=0E(f(X)g(Y))=0

2.方差

若数学期望E(X−EX)2E(X-EX)^2E(XEX)2存在 称其为随机变量X的方差,记为VarX
σX=σ(X)=VarX\sigma_X=\sigma(X) = \sqrt{VarX}σX=σ(X)=VarX是X的标准差

性质
1)Var( c ) = 0
2) Var(aX+b) = a2a^2a2Var(X)
3) VarX = EX2−(EX)2EX^2 - (EX)^2EX2(EX)2
4) VarX ⩾\geqslant 0
5) Var(X±Y) = VarX + VarY ± 2E[(X−EX)(Y−EY)]2E[(X-EX)(Y-EY)]2E[(XEX)(YEY)]
6) XY相互独立, Var(X±Y)=VarX+VarY

马尔科夫不等式
随机变量X方差存在,对任意ϵ\epsilonϵ>0
P(X≥ϵ)≤EXϵP(X≥\epsilon)≤\frac{EX}{\epsilon}P(Xϵ)ϵEX

切比雪夫不等式
P{∣X−EX∣≥ϵ}≤VarXϵ2P\{|X-EX|≥\epsilon\}≤\frac{VarX}{\epsilon^2}P{XEXϵ}ϵ2VarXP{∣X−EX∣<ϵ}≥1−VarXϵ2P\{|X-EX|<\epsilon\}≥1-\frac{VarX}{\epsilon^2}P{XEX<ϵ}1ϵ2VarX

3.协方差与相关系数

定义
设(X,Y)是二维随机变量,若E[(X−EX)(Y−EY)]E[(X-EX)(Y-EY)]E[(XEX)(YEY)]存在 称之为X和Y的协方差,记为Cov(X,Y)

性质
1)Cov(X,Y)=Cov(Y,X)Cov(X,Y) = Cov(Y,X)Cov(X,Y)=Cov(Y,X)    Cov(X,X)=VarX\ \ \ Cov(X,X) = VarX   Cov(X,X)=VarX
2)Cov(X,a)=0   Cov(aX,bY)=abCov(X,Y)Cov(X,a)=0\ \ \ Cov(aX,bY)=abCov(X,Y)Cov(X,a)=0   Cov(aX,bY)=abCov(X,Y)
3)Cov(X,Y)=E(XY)−EXEYCov(X,Y)=E(XY)-EXEYCov(X,Y)=E(XY)EXEY
4)X和Y相互独立,有Cov(X,Y) = 0 (反之不一定成立
5)Cov(X+Y,Z) = Cov(X,Z) + Cov(Y,Z)
6) Var(X±Y) = VarX+VarY +=2Cov(X,Y)

定义
Corr(X,Y)=Cov(X,Y)VarXVarYCorr(X,Y)=\frac{Cov(X,Y)}{\sqrt{VarX}\sqrt{VarY}}Corr(X,Y)=VarXVarYCov(X,Y)
是X和Y的相关系数,可记ρXY\rho_{XY}ρXY
取值在-1到1之间
X∗=X−EXVarXY∗=Y−EYVarY EX∗=EY∗=0VarX∗=VarY∗=1X^{*} = \frac{X-EX}{\sqrt{VarX}}\quad Y^{*} = \frac{Y-EY}{\sqrt{VarY}}\\ \\\ \\ EX^*=EY^* = 0\\ VarX^* = VarY^* = 1X=VarXXEXY=VarYYEY EX=EY=0VarX=VarY=1

定理
|Corr(X,Y)|≤1
==1的时候当且仅当X与Y有线性关系
即存在a,b使得P(Y=aX+b) ==1

推论
Cauchy-Schwarz不等式
∣Corr(X,Y)∣≤1|Corr(X,Y)|≤1Corr(X,Y)1
得到∣E((X−EX)(Y−EY))∣2≤VarX⋅VarY|E((X-EX)(Y-EY))|^2≤VarX\cdot VarYE((XEX)(YEY))2VarXVarY
一般期望存在,有
∣E(XY)∣2≤EX2EY2|E(XY)|^2≤EX^2EY^2E(XY)2EX2EY2

对于(X,Y)~N【注意要联合分布】
Corr(X,Y) = ρ\rhoρ 对于二维正态分布,不相关 和 独立等价

4 矩和其他数字特征


E(X−EX)kE(X-EX)^kE(XEX)k是X的k阶中心矩,记为νk\nu_kνk
EXkEX^kEXk是X的原点矩 记为μk\mu_kμk

偏度系数
X的三阶矩μ3\mu_3μ3存在,称βS=ν3σ3\beta_S = \frac{\nu_3}{\sigma^3}βS=σ3ν3是X的偏度系数
σ=ν2\sigma = \sqrt{\nu_2}σ=ν2是X的标准差

峰度系数
随机变量X的四阶矩μ4\mu_4μ4存在
βk=ν4ν22−3\beta_k=\frac{\nu_4}{\nu_2^2}-3βk=ν22ν43是X的峰度系数

变异系数
随机变量二阶矩μ2\mu_2μ2存在且数学期望μ1=EX≠0\mu_1=EX≠0μ1=EX=0,称
Cv=ν2μ1=1αC_v=\frac{\sqrt{\nu_2}}{\mu_1}=\frac{1}{\sqrt{\alpha}}Cv=μ1ν2=α1

分位数
F是X的分布函数,α∈(0,1)
xα=inf{x:F(x)≥α}x_{\alpha}=inf\{x:F(x)≥\alpha \}xα=inf{x:F(x)α} (下分位数点)

中位数
F是X的分布函数,x1/2x_{1/2}x1/2是X或F的中位数
P<中位数的部分 = P > 中位数的部分

5 极限定理

中心极限定理

随机变量X服从二项分布 b(n,p)
当n充分大
可以用 N(np,np(1-p)) 来近似求解

若n趋于无穷,Sn=∑k=1nXkS_n = \sum^n_{k=1}X_kSn=k=1nXk渐进服从正态分布,即
Sn−ESnVarSn\frac{S_n-ES_n}{\sqrt{VarS_n}}VarSnSnESn的分布函数Fn(x)收敛于Φ(x)F_n(x)收敛于\Phi(x)Fn(x)收敛于Φ(x)
我们称{Xn,n≥1}\{X_n,n≥1\}{Xn,n1}服从中心极限定理

林德贝格——勒维中心定理
独立同分布的随机变量序列,数学期望为μ\muμ方差是σ2\sigma^2σ2

lim⁡n→∞P{Sn−nμσn≤y}=Φ(x)\lim_{n\rightarrow∞}P\{\frac{S_n-n\mu}{\sigma\sqrt{n}}≤y\} = \Phi(x)nlimP{σnSnnμy}=Φ(x)

德莫弗——拉普拉斯中心定理
符合二项分布Y_n~b(n,p)
lim⁡n→∞P{Yn−npnp(1−p)≤y}=Φ(x)\lim_{n\rightarrow∞}P\{\frac{Y_n-np}{\sqrt{np(1-p)}}≤y\} = \Phi(x)nlimP{np(1p)Ynnpy}=Φ(x)

大数定理

X和X_1,X_2……都在同一个概率空间中
对任意的ϵ>0\epsilon > 0ϵ>0
lim⁡n→∞P(∣Xn−X∣≥ϵ)=0\lim_{n\rightarrow∞}P(|X_n-X|≥\epsilon)=0limnP(XnXϵ)=0
称随机变量序列{Xn,n≥1}\{X_n,n≥1\}{Xn,n1}依概率收敛到X

记为Xn→PXX_n\rightarrow^PXXnPX
定义
Sn−ESnn→P  0\frac{S_n-ES_n}{n}\rightarrow^P\ \ 0nSnESnP  0

Bernoulli大数定理
X1,X2……独立同分布,共同分布满足b(1,p)
Snn→Pp\frac{S_n}{n}\rightarrow^P pnSnPp

切比雪夫大数定理
随机变量序列,两两互不相关(Cov(X_i,X_j) == 0) 且他们的方差一致有界,其满足大数定理

马尔可夫大数定理
1n2Var(∑k=1nXk)→0\frac{1}{n^2}Var(\sum^n_{k=1}X_k)\rightarrow0n21Var(k=1nXk)0
其满足大数定理

Khinchin大数定理
X1,X2……独立同分布,EX1存在
则随机变量序列{Xn,n⩾1}\{X_n,n\geqslant 1\}{Xn,n1}服从大数定理

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值