随机变量及其分布和几种常见分布

本文介绍了离散型与连续型随机变量的概念、分布及性质,包括0-1分布、二项分布、泊松分布、几何分布、超几何分布、均匀分布、指数分布和正态分布等,并详细阐述了这些分布的特点和应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

符号


(I)(I)(0-1)分布(离散型)

XB(1,p)X∼B(1,p)

(II)(II)伯努利试验,二项分布(离散型)
XB(n,p)X∼B(n,p)

(III)(III)泊松分布(离散型)
Xπ(λ)X∼π(λ)

(IV)(IV)几何分布(离散型)
XG(p)X∼G(p)

(V)(V)超几何分布(离散型)
XH(n,M,N)X∼H(n,M,N)

(VI)(VI)均匀分布(连续型)
XU(a,b)X∼U(a,b)

(VII)(VII)指数分布(连续型)
XE(θ)X∼E(θ)

(VIII)(VIII)正态分布(连续型)
XN(μ,σ2)X∼N(μ,σ2)

标准正态分布:
XN(0,1)X∼N(0,1)

随机变量

定义:
设随机试验的样本空间S={e}.X=X(e)S={e}.X=X(e)是定义在样本空间SS上的 实值单值函数。称X=X(e) 随机变量
投掷一枚硬币三次,观察出现正面和反面的情况
样本空间是:

S={HHH,HHT,HTH,THH,HTT,THT,TTH,TTT}S={HHH,HHT,HTH,THH,HTT,THT,TTH,TTT}

XX记三次投掷得到正面H的总数,那么对于样本空间S={e}S={e}中每一个样本点eeX都有一个数与之对应。XX是定义在样本空间S上的一个实值单值函数,他的定义域是样本空间SS,值域是实数集合{0,1,2,3},使用函数标记可以将XX写成:
X=X(e)={3,e=HHH2,e=HHT,HTH,THH1,e=HTT,THT,TTH0,e=TTT

离散型随机变量及其分布律

有些随机变量,他的全部可能取值是有限个或者可列无限多个,这种随机变量称为离散型随机变量
设离散型随机变量XX的所有可能取值为xk(k=1,2,),XX取各个可能值得概率,即事件{X=xk}的概率,为

P{X=xk}=pk,k=1,2,.(1)(1)P{X=xk}=pk,k=1,2,⋯.

由概率的定义,pkpk满足如下两个条件:


11∘pk0,k=1,2,;pk≥0,k=1,2,⋯;
22∘k=1pk=1.∑k=1∞pk=1.

我们称(1)(1)为离散型随机变量XX分布律。分布律也可以用表格的形式来表示
这里写图片描述

(I)(0-1)分布(离散型)

设随机变量XX只可能取011两个值,它的分布律是

P{X=k}=pk(1p)1k,k=0,1(0<p<1)

则称XX服从以p为参数的(01)(0−1)分布或两点分布
(01)(0−1)分布也可以写成
这里写图片描述
对于一个随机试验,如果它的样本空间只包含两个元素,即S={e1,e2}S={e1,e2},我们总能在SS上定义一个服从(01)分布的随机变量

X=X(e)={0,e=e11,e=e2X=X(e)={0,当e=e11,当e=e2

(II)(II)伯努利试验,二项分布(离散型)

设试验EE只有两个可能结果:AA¯¯¯¯,则称EE伯努利试验(Bernoulli)试验
。设P(A)=p(0<p<1),此时P(A¯¯¯¯)=1pP(A¯)=1−p.将EE独立重复地进行n次,则称这一连串重复地独立试验为nn重伯努利试验
这里的重复是指在每次试验中P(A)=p保持不变;
独立是指各次试验结果互不影响,即若以CiCi记第ii次试验的结果,CiAAA¯i=1,2,,n.
独立是指

P(C1C2Cn)=P(C1)P(C2)P(Cn)P(C1C2⋯Cn)=P(C1)P(C2)⋯P(Cn)
.

XX表示n重伯努利试验中事件AA发生的次数X是一个随机变量,我们求它的分布律。XX的所有可能取值为0,1,2,,n.由于各次试验是相互独立的,因此事件AA在指定的k(0kn)次试验中发生,在其他nkn−k次试验中AA不发生的概率为

pp  pk(1p)(1p)  (1p)(n-k)=pk(1p)nk

这种指定的方式共有(nk)(nk)种,它们是两两互不相容的,故在nn次试验中A发生kk次的概率是(nk)pk(1p)nk,记q=1pq=1−p,即有
P{X=k}=(nk)pk(1p)nk,k=0,1,2,,n.P{X=k}=(nk)pk(1−p)n−k,k=0,1,2,⋯,n.

显然:
P{X=k}0,k=0,1,2,,n;P{X=k}≥0,k=0,1,2,⋯,n;

k=0nP{X=k}=k=0n(nk)pk(1p)nk=(p+q)n=1∑k=0nP{X=k}=∑k=0n(nk)pk(1−p)n−k=(p+q)n=1

所以P{X=k}P{X=k}满足条件1,21∘,2∘,注意到(nk)pkqnk(nk)pkqn−k刚好是二项式(p+q)n(p+q)n的展开式中pkpk的那一项,我们称变量XX服从参数为n,p的二项分布,并记为Xb(n,p)X∼b(n,p).
特别的,当n=1n=1时二项分布化为
P{X=k}=pkq1k,k=0,1P{X=k}=pkq1−k,k=0,1

这就是(01)(0−1)分布.

(III)(III)泊松分布(离散型)

设随机变量XX所有可能取值为0,1,2,,而取各个值得概率是

P{X=k}=λkeλk!,k=0,1,2,P{X=k}=λke−λk!,k=0,1,2,⋯

其中λ>0λ>0是常数。则称XX是服从参数λ泊松分布,记为Xπ(λ)X∼π(λ)
对于条件1,21∘,2∘
P{X=k}0,k=0,1,2,P{X=k}≥0,k=0,1,2,⋯且有
k=0P{X=k}=k=0λkeλk!=eλk=0λkk!=eλeλ=1∑k=0∞P{X=k}=∑k=0∞λke−λk!=e−λ∑k=0∞λkk!=e−λ⋅eλ=1

泊松定理

λ>0λ>0是一个常数,nn是任意正整数,设npn=λ

,则对任意一个固定的非负整数kk,有
limn(nk)pnk(1pn)nk=λkeλk!

证:
pn=λnpn=λn
(nk)pkn(1pn)nk=n(n1)(nk+1)k!(λn)k(1λn)nk=λkk![1(11n)(1k1n)](1λn)n(1λn)k(nk)pnk(1−pn)n−k=n(n−1)⋯(n−k+1)k!(λn)k(1−λn)n−k=λkk![1⋅(1−1n)⋯(1−k−1n)](1−λn)n(1−λn)−k

对任意固定的kk,当n
1(11n)(1k1n)1,(1λn)neλ,(1λn)k1.1⋅(1−1n)⋯(1−k−1n)→1,(1−λn)n→e−λ,(1−λn)−k→1.

故有:
limn(nk)pkn(1pn)nk=λkeλk!limn→∞(nk)pnk(1−pn)n−k=λke−λk!

(IV)(IV)几何分布(离散)

如果XX的概率分布为P{X=k}=qk1p(k=1,2;0<p<1;q=1p)则称XX服从参数为P的几何分布,记为XG(p)X∼G(p)

(V)(V)超几何分布(离散)

从一个有限总体中进行不放回抽样常会遇到超几何分布
设由NN个产品组成的总体,其中含有M个不合格品,若从中随机不放回地抽取nn个,其中含有不合格的产品个数X是一个离散型随机变量,假如nMn≤M,则XX的可能取值为0,1,,n;若XX可能取值0,1,,M由古典方法

P{X=x}=CxMCnxNMCnN(*)(*)P{X=x}=CMxCN−Mn−xCNn

由组合等式
x=0rCxMCnxNM=CnN∑x=0rCMxCN−Mn−x=CNn

可以看出上述的概率之和为11,即x=0rP{X=x}=1式所表示的一组概率构成一个概率分布,这个分布称为超几何分布
它含有三个参数N,M,n记为XH(n,N,M)X∼H(n,N,M)
数学期望
XH(n,N,M)X∼H(n,N,M),则数学期望为
E(X)=x=0rxCxMCnxNMCnN=nMNx=1rCx1M1CnxNMCn1N1=nMNE(X)=∑x=0rxCMxCN−Mn−xCNn=nMN∑x=1rCM−1x−1CN−Mn−xCN−1n−1=nMN

nNn≪N(即抽取个数nn远远小于产品数N)时,每次抽取后,总体中不合格品率p=MNp=MN改变非常小,这时候的不放回抽样可以看成是放回抽样,这时候超几何分布可以用二项分布来近似。

随机变量的分布函数

XX是一个随机变量,x是任意实数,函数

F(x)=P{Xx},<x<+F(x)=P{X≤x},−∞<x<+∞

称为XX的分布函数。
对于任意实数x1,x2,(x1<x2),有
P{x1<Xx2}=P{Xx2}P{Xx1}=F(x2)F(x1)(A)(A)P{x1<X≤x2}=P{X≤x2}−P{X≤x1}=F(x2)−F(x1)

因此如果已知XX分布函数,我们就知道X落在区间(x1,x2](x1,x2]上的概率。
如果将XX看成是数轴上的随机点的坐标,那么,分布函数F(x)xx处的函数值就表示X落在区间D(,x](−∞,x]上的概率。
分布函数F(x)F(x)具有以下的基本性质:

11∘:
F(x)F(x)是一个不减函数
事实上式(A)(A)对于任意的实数x1,x2(x1<x2)x1,x2(x1<x2),有
F(x2)F(x1)=P{x1<Xx2}0F(x2)−F(x1)=P{x1<X≤x2}≥0

22∘:
0F(x)10≤F(x)≤1,且
F()=limxF(x)=0,F()=limxF(x)=1F(−∞)=limx→−∞F(x)=0,F(∞)=limx→∞F(x)=1

33∘:
F(x+0)=F(x)F(x+0)=F(x)

连续型随机变量概率密度

如果对于随机变量XX的分布函数F(x),存在非负可积函数f(x)f(x),对于任意实数xx

F(x)=xf(t)dt

则称XX连续型随机变量f(x)称为XX概率密度函数,简称概率密度
概率密度函数的性质:

1:

f(x)0;f(x)≥0;

22∘:
+f(x)dx=1∫−∞+∞f(x)dx=1

33∘:对于任意实数x1,x2(x1x2)x1,x2(x1≤x2),
P{x1<Xx2}=F(x2)F(x1)=x2x1f(x)dxP{x1<X≤x2}=F(x2)−F(x1)=∫x1x2f(x)dx

44∘:若f(x)f(x)在点xx处连续,则有F(x)=f(x)

f(x)f(x)具备性质1,21∘,2∘,引入G(x)=xf(t)dtG(x)=∫−∞xf(t)dt,它是某一随机变量XX分布函数,f(x)XX的概率密度。

三个重要的连续型随机变量

(VI)均匀分布(连续型)

若连续型随机变量XX具有概率密度

f(x)={1ba,a<x<b0,

则称XX在区间(a,b)上服从均匀分布。记为XU(a,b)X∼U(a,b)

分布函数

F(x)=0xaba1,x<a,ax<b,xbF(x)={0,x<ax−ab−a,a≤x<b1,x≥b

(VII)(VII)指数分布(连续型)

若连续型随机变量XX具有概率密度

f(x)={1θex/θ,x>00,

分布函数

F(x)={1ex/θ0,x>0,F(x)={1−e−x/θ,x>00,其他


无记忆性:
对于任意的s,t>0s,t>0,有
P{X>s+tX>s}=P{X>t}P{X>s+t∣X>s}=P{X>t}


P{X>s+tX>s}=P{(X>s+t)(X>s)}P{X>t}=P{X>s+t}P{X>t}=1F(s+t)1F(s)=e(s+t)/θes/θ=et/θ=P{X>t}P{X>s+t∣X>s}=P{(X>s+t)∩(X>s)}P{X>t}=P{X>s+t}P{X>t}=1−F(s+t)1−F(s)=e−(s+t)/θe−s/θ=e−t/θ=P{X>t}

(VIII)(VIII)正态分布(连续型)

若连续型随机变量XX具有概率密度

f(x)=12πσe(xμ)22σ2,<x<+

其中μ,σ(σ>0)μ,σ(σ>0)为常数,则称XX服从参数为μ,σ正态分布高斯分布,记为XN(μ,σ2)X∼N(μ,σ2)
相关性质:

11∘:曲线关于x=μx=μ对称,这表明对于任意h>0h>0
P{μh<Xμ}=P{μ<Xμ+h}P{μ−h<X≤μ}=P{μ<X≤μ+h}

22∘:当x=μx=μ时取到最大值
f(μ)=12πσf(μ)=12πσ


分布函数

F(x)=12πσxe(tμ)22σ2dtF(x)=12πσ∫−∞xe−(t−μ)22σ2dt

标准正态分布
特别当μ=0,σ=1μ=0,σ=1时称变量XX服从标准正态分布,其概率密度和分布函数分别用ϕ(x),Φ(x)表示,既有:

ϕ(x)=12πex2/2Φ(x)=12πxet2/2dtΦ(x)=1Φ(x)ϕ(x)=12πe−x2/2Φ(x)=12π∫−∞xe−t2/2dt容易得到:Φ(−x)=1−Φ(x)

引理:
XN(μ,σ2)X∼N(μ,σ2),则Z=XμσN(0,1)Z=X−μσ∼N(0,1)
证:
P{Zx}tμσ=uP{Zx}=P{Xμσx}=P{Xμ+σx}=12πμ+σxe(tμ)22σ2dt=12πxeu2/2du=Φ(x)P{Z≤x}=P{X−μσ≤x}=P{X≤μ+σx}=12π∫−∞μ+σxe−(t−μ)22σ2dt令:t−μσ=u,得P{Z≤x}=12π∫−∞xe−u2/2du=Φ(x)
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值