第2章 随机变量及概率分布

本文深入探讨了随机变量的概念,区分了离散型和连续型随机变量,并详细阐述了它们的分布,如二项分布、泊松分布、正态分布等。进一步,文章讲解了多维随机变量、条件概率分布以及随机变量的独立性。最后,介绍了随机变量的函数的概率分布,包括随机变量和的密度函数以及随机变量的商的密度函数,如伽马分布、卡方分布和t分布等。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

# 第2章 随机变量及概率分布
[TOC]

2.1 一维随机变量

2.1.1 随机变量的概念

随机变量就是“其值随机会而定”的变量。
用随机变量加限制的方法,可以表示一个事件。
按取值全体的性质,随机变量分为两大类:
- 离散型随机变量
- 连续型随机变量

“连续型随机变量”这个概念只是一个数学上的抽象。

2.1.2 离散型随机变量的分布及重要例子

设X为离散型随机变量,其全部可能值为 {a1,a2,} ,则

pi=P(X+=ai)(i=1,2,)

称为X的概率函数

设X为离散型随机变量,则函数

P(Xx)=F(x)(<x<)

称为X的分布函数

因此可知:

F(i)=F(i1)+P(X=i)

pi=P(X=i)=F(i)F(i1)

对于任何随机变量X,其分布函数F(x)具有以下一般性质:
1.F(x)是单调非降的。
2.当 x 时, F(x)1 ,当 x 时, F(x)0

下面是几个重要的离散型随机变量的例子:

  • 二项分布
    已知A的概率p,X记为n次试验中A出现的次数。记为 XB(n,p)

pi=b(i;n,p)=(ni)pi(1p)ni(i=0,1,,n)

二项分布有两个条件:一是各次试验的条件是稳定的,这保证了p不变。二是各次试验的独立性。

  • 泊松分布
    当X表示在一段时间或空间内出现的事件个数。记为 XP(λ)

P(X=i)=eλλii!

二项分布中,当n很大,p很小, np=λ 不太大时,X的这个二项分布接近于泊松分布 P(λ) 。因此有时可以用泊松分布来计算二项分布。

在设计到抽样的问题中常用。N个产品中有M个废品,以X记从N个产品中随机抽出n个里面所含有的废品数。

P(X=m)=(Mm)(NMnm)/(Nn)

  • 负二项分布
    一批产品废品率p。逐一抽取直到抽到r个废品,X记为此时合格品的个数。

P(X=i)=(i+r1r1)pr(1p)i(i=0,1,2,)

  • 几何分布
    负二项分布中,当抽到1个废品就停止,即令r=1。

P(X=i)=p(1p)i(i=0,1,2,)

2.1.3 连续型随机变量的分布及重要例子

设连续型随机变量X有概率分布函数F(x),则F(x)的导数 f(x)=F(x) 称为X的概率密度函数。其具有以下三条性质:
1. f(x)0
2. f(x)dx=1
3.对任何常数 a<b 有:

P(aXb)=F(b)F(a)=baf(x)dx

重要的例子们有:

  • 正态分布
    记为 XN(μ,σ2) ,关于 μ点对称,而后往两个方向衰减。

f(x)=(2πσ)1e(xμ)22σ2

N(0,1) 称为标准正态分布,之所以重要,是因为可以用标准正态分布去计算正态分布。因为:

XN(μ,σ2)Y=(Xμ)/σN(0,1)

  • 指数分布
    常用于寿命分布。X取的意义类似于“可以撑过多久”。这里并不考虑老化的问题,即失效率是不随x变化的。

f(x)={λeλx,x>00x0

  • 威布尔分布
    常用于寿命分布。X取的意义类似于“可以撑过多久”。考虑老化的问题。 λ 与x有关。
    要解下面的微分方程(以 λ=λxm 为例):

F/[1F(x)]=λxm

  • 均匀分布

f(x)={1/(ba),axb0F(x)=0xa(xa)/(ba),a<x<b1xb

2.2 多维随机变量(随机向量)

2.2.1 离散型随机向量的分布

X=(X1,X2,,Xn) 为一个N维向量, X1,X2,,Xn 都是一维随机变量,则称X是一个n维随机向量n维随机变量

{ai1,ai2,} Xi 的全部可能值, (i=1,2,) ,则事件 {X1=a1j1,X2=a2j2,,Xn=anjn} 的概率

p(j1,j2,,jn)=P(X1=a1j1,X2=a2j2,,Xn=anjn)>(j1=1,2,;j2=1,2,;;jn=1,2,;)>

称为随机向量 X=(X1,X2,,Xn) 的概率函数或概率分布,其应满足以下条件:

p(j1,j2,,jn)0jnj2j1p(j1,j2,,jn)=1

  • 多项分布
    常用于将一堆事物分为几类,抽取,查看各类抽取若干个时的概率。假设的是各个事物的比率在抽取的过程中不变化。

P(X1=k1,X2=k2,,Xn=kn)=N!k1!k2!kn!pk11pk22pknn

当n=2时,就回到了二项分布的情形。

2.2.2 连续型随机向量的分布

X=(X1,X2,,Xn) ,如果X的取值能够充满 Rn 中的某一区域,则称X是连续的。

f(x1,,xn) 是定义在 Rn 上的非负函数,使对 Rn 上的任何集合A,有

P(XA)=Af(x1,,xn)dx1dx2dxn

则称f是X的(概率)密度函数。

  • 二维正态分布

f(x1,x2)=(2πσ1σ21ρ2)1exp[12(1ρ2)((x1a)2σ212ρ(x1a)(x2b)σ1σ2+(x2b)2σ22)]

记为 N(a,b,σ21,σ22,ρ)

2.2.3 边缘分布

X=(X1,X2,,Xn) Xi 的分布称为X或X的分布的“边缘分布”。
设X的概率密度函数为 f(x1,,xn) ,则 X1 的分布为:

f1(x1)=f(x1,,xn)dx2dxn

N(a,b,σ21,σ22,ρ) 的边缘分布分别是 N(a,σ21) N(b,σ22)
多项分布的边缘分布是二项分布。

但是即使知道了边缘分布,也不能确定联合分布,因为没有给出边缘分布之间的关系。以二维正态分布为例 ρ给出的就是两个边缘分布之间的关系。

2.3 条件概率分布与随机变量的独立性

2.3.1 条件概率分布的概念

一个随机变量或向量X的条件概率分布,就是在某种给定的条件下X的概率分布。

2.3.2 离散型随机变量的条件概率分布

与第1章中的概念及计算方法一样。

P(X1=ai|X2=bj)=P(X1=ai,X2=bj)/P(X2=bj)

将联合概率分布记为:

pij=P(X1=ai,X2=bj)(i,j=1,2,)

则条件概率分布也可以写成:

P(X1=ai|X2=bj)=pij/kpkj)(j=1,2,)

多项分布在给定一项的条件时,另一项是二项分布。

2.3.3 连续型随机变量的条件分布

二维随机向量 X=(X1,X2) ,

f1(x1|aX2b)=baf(x1,t2)dt2/baf2(t2)dt2

f1(x1|x2)=f(x1,x2)/f2(x2)

正态变量的条件分布仍为正态。二维正态分布中, ρ>0称为“正相关”,ρ<0称为“负相关”。

2.3.4 随机变量的独立性

如果 f1(x1|x2) 不依赖于 x2 ,而只是 x1 的函数,就称 X1X2 这两个随机变量(在概率论意义上)独立。此时:

f1(x1,x2)=f1(x1)f2(x2)

变量独立则事件独立,事件独立则变量独立。

若连续型随机向量 X=(X1,X2,,Xn) 的概率密度函数 f(x1,,xn) 可表为n个函数之积,即:

f(x1,,xn)=g1(x1)gn(xn)

其中 gi 只依赖于 xi ,则 X=(X1,X2,,Xn) 相互独立,且 Xi 的边缘密度函数 fi(xi) gi(xi) 只相差一个常数因子。

2.4 随机变量的函数的概率分布

已知一些分布,通过函数关系去求另一些分布。

2.4.1 离散型分布的情况

关键是通过函数关系求出Y后,有没有相重的Y。相重的Y的概率要合并起来。

2.4.2 连续型分布的情况:一般讨论

设X有密度函数f(x),Y=g(X),g的反函数为X=h(Y)。g是严格上升的函数。则Y的密度函数为:

l(Y)=f(h(y))|h(y)|

多维随机向量的情况:

l(y1,y2,,yn)=f(h1(y1,y2,,yn),h2(y1,y2,,yn),,hn(y1,y2,,yn))|J(y1,y2,,yn)|

由于做了变量替换,要注意取值范围。

2.4.3 随机变量和的密度函数

Y=X1+X2

l(y)=f1(x)f2(yx)dx=f1(yx)f2(x)dx

两个正态分布的和也是正态分布。一个二维正态分布表成两个随机变量之和,随机变量也服从正态分布。

三大分布
Γ函数:

Γ(x)=0ettx1dt(x>0)

Γ(1)=1

Γ(12)=π

Γ(x+1)=xΓ(x)

Γ(n)=(n1)!

Γ(n/2)=135(n2)2(n1)/2π

  • 自由度为n的皮尔逊卡方分布 χ2n
    概率密度:

kn(x)=1Γ(n2)2n/2ex/2x(n2)/2,x>00x0

X1,X2,,Xn 相互独立,都服从N(0,1),则 Y=X21+X22++X2nχ2n
性质:
1.设 X1,X2 独立, X1χ2mX2χ2n ,则 X1+X2χ2m+n
2.设 X1,X2,,Xn 独立,都服从指数分布,则 X=2λ(X1++Xn)χ22n

2.4.4 随机变量的商的密度函数

X1,X2 有密度函数 f(x1,x2) Y=X2/X1 ,则:

l(y)=0x1f1(x1)f2(x1y)dx1

  • 自由度n的t分布 tn
    X1,X2 独立, X1χ2nX2N(0,1) Y=X2/X1/n ,则Y服从自由度n的t分布:

tn(y)=Γ((n+1)/2)nπΓ(n/2)(1+y2n)n+12

  • 自由度(m,n)的F分布 Fmn
    X1,X2 独立, X1χ2nX2χ2m Y=m1X2/n1X1 ,则Y服从自由度(m,n)的F分布:

fmn(y)=mm/2nn/2Γ(m+n2)Γ(m2)Γ(n2)ym/21(my+n)(m+n)/2(y>0)

Γ2n,tn,Fmn 称为统计上的三大分布。

三大分布很重要主要是因为:
1.设 X1,X2,,Xn 独立同分布,有公共的正态分布 N(μ,σ2) ,记 X¯=(X1+X2++Xn)/n S2=ni=1(XiX¯)2/(n1) ,则:

(n1)S2/σ2=i=1n(XiX¯)2/σ2χ2n1

2.假设同1,则:

n(X¯μ)/Stn1

3.设 X1,X2,,Xn 独立同分布, Y1,Y2,,Ym 独立同分布, XiN(μ1,σ21),YiN(μ2,σ22) ,则:

mj=1(YjY¯)2/(σ22(m1))ni=1(XiX¯)2/(σ21(n1))Fm1,n1

σ21=σ22 ,则:

nm(n+m2)n+m[(X¯Y¯)(μ1μ2)][ni=1(XiX¯)2+mj=1(YjY¯)2]1/2tn+m2

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值