符号
(I)(I)(0-1)分布(离散型)
X∼B(1,p)X∼B(1,p)
(II)(II)伯努利试验,二项分布(离散型)X∼B(n,p)X∼B(n,p)
(III)(III)泊松分布(离散型)
X∼π(λ)X∼π(λ)
(IV)(IV)几何分布(离散型)X∼G(p)X∼G(p)
(V)(V)超几何分布(离散型)X∼H(n,M,N)X∼H(n,M,N)
(VI)(VI)均匀分布(连续型)
X∼U(a,b)X∼U(a,b)
(VII)(VII)指数分布(连续型)
X∼E(θ)X∼E(θ)
(VIII)(VIII)正态分布(连续型)
X∼N(μ,σ2)X∼N(μ,σ2)
标准正态分布:X∼N(0,1)X∼N(0,1)
随机变量
定义:
设随机试验的样本空间S={e}.X=X(e)S={e}.X=X(e)是定义在样本空间SS上的 实值单值函数。称X=X(e)为 随机变量。
投掷一枚硬币三次,观察出现正面和反面的情况
样本空间是:
S={HHH,HHT,HTH,THH,HTT,THT,TTH,TTT}S={HHH,HHT,HTH,THH,HTT,THT,TTH,TTT}
以
XX记三次投掷得到正面
H的总数,那么对于样本空间
S={e}S={e}中每一个样本点
ee,
X都有一个数与之对应。
XX是定义在样本空间
S上的一个实值单值函数,他的定义域是样本空间
SS,值域是实数集合
{0,1,2,3},使用函数标记可以将
XX写成:
X=X(e)=⎧⎩⎨⎪⎪⎪⎪⎪⎪3,2,1,0,e=HHHe=HHT,HTH,THHe=HTT,THT,TTHe=TTT
离散型随机变量及其分布律
有些随机变量,他的全部可能取值是有限个或者可列无限多个,这种随机变量称为离散型随机变量。
设离散型随机变量XX的所有可能取值为xk(k=1,2,⋯),XX取各个可能值得概率,即事件{X=xk}的概率,为
P{X=xk}=pk,k=1,2,⋯.(1)(1)P{X=xk}=pk,k=1,2,⋯.
由概率的定义,
pkpk满足如下两个条件:
1∘1∘,pk≥0,k=1,2,⋯;pk≥0,k=1,2,⋯;
2∘2∘,∑k=1∞pk=1.∑k=1∞pk=1.
我们称(1)(1)为离散型随机变量XX的分布律。分布律也可以用表格的形式来表示

(I)(0-1)分布(离散型)
设随机变量XX只可能取0与11两个值,它的分布律是
P{X=k}=pk(1−p)1−k,k=0,1(0<p<1)
则称
XX服从以
p为参数的
(0−1)(0−1)分布或两点分布。
(0−1)(0−1)分布也可以写成
对于一个随机试验,如果它的样本空间只包含两个元素,即
S={e1,e2}S={e1,e2},我们总能在
SS上定义一个服从
(0−1)分布的随机变量
X=X(e)={0,当e=e11,当e=e2X=X(e)={0,当e=e11,当e=e2
(II)(II)伯努利试验,二项分布(离散型)
设试验EE只有两个可能结果:A与A¯¯¯¯A¯,则称EE为伯努利试验(Bernoulli)试验。
。设P(A)=p(0<p<1),此时P(A¯¯¯¯)=1−pP(A¯)=1−p.将EE独立重复地进行n次,则称这一连串重复地独立试验为nn重伯努利试验。
这里的重复是指在每次试验中P(A)=p保持不变;
独立是指各次试验结果互不影响,即若以CiCi记第ii次试验的结果,Ci为AA或A¯¯¯¯,i=1,2,⋯,n.
独立是指
P(C1C2⋯Cn)=P(C1)P(C2)⋯P(Cn)P(C1C2⋯Cn)=P(C1)P(C2)⋯P(Cn)
.
以XX表示n重伯努利试验中事件AA发生的次数,X是一个随机变量,我们求它的分布律。XX的所有可能取值为0,1,2,⋯,n.由于各次试验是相互独立的,因此事件AA在指定的k(0≤k≤n)次试验中发生,在其他n−kn−k次试验中AA不发生的概率为
p⋅p⋅ ⋯ ⋅pk⋅(1−p)⋅(1−p)⋅ ⋯ ⋅(1−p)(n-k)=pk(1−p)n−k
这种指定的方式共有
(nk)(nk)种,它们是
两两互不相容的,故在
nn次试验中
A发生
kk次的概率是
(nk)pk(1−p)n−k,记
q=1−pq=1−p,即有
P{X=k}=(nk)pk(1−p)n−k,k=0,1,2,⋯,n.P{X=k}=(nk)pk(1−p)n−k,k=0,1,2,⋯,n.
显然:
P{X=k}≥0,k=0,1,2,⋯,n;P{X=k}≥0,k=0,1,2,⋯,n;
∑k=0nP{X=k}=∑k=0n(nk)pk(1−p)n−k=(p+q)n=1∑k=0nP{X=k}=∑k=0n(nk)pk(1−p)n−k=(p+q)n=1
所以
P{X=k}P{X=k}满足条件
1∘,2∘1∘,2∘,注意到
(nk)pkqn−k(nk)pkqn−k刚好是二项式
(p+q)n(p+q)n的展开式中
pkpk的那一项,我们称变量
XX服从参数为
n,p的二项分布,并记为
X∼b(n,p)X∼b(n,p).
特别的,当
n=1n=1时二项分布化为
P{X=k}=pkq1−k,k=0,1P{X=k}=pkq1−k,k=0,1
这就是
(0−1)分布(0−1)分布.
(III)(III)泊松分布(离散型)
设随机变量XX所有可能取值为0,1,2,⋯,而取各个值得概率是
P{X=k}=λke−λk!,k=0,1,2,⋯P{X=k}=λke−λk!,k=0,1,2,⋯
其中
λ>0λ>0是常数。则称
XX是服从参数
λ的
泊松分布,记为
X∼π(λ)X∼π(λ)
对于条件
1∘,2∘1∘,2∘
P{X=k}≥0,k=0,1,2,⋯P{X=k}≥0,k=0,1,2,⋯且有
∑k=0∞P{X=k}=∑k=0∞λke−λk!=e−λ∑k=0∞λkk!=e−λ⋅eλ=1∑k=0∞P{X=k}=∑k=0∞λke−λk!=e−λ∑k=0∞λkk!=e−λ⋅eλ=1
泊松定理
设λ>0λ>0是一个常数,nn是任意正整数,设npn=λ
,则对任意一个固定的非负整数
kk,有
limn→∞(nk)pkn(1−pn)n−k=λke−λk!
证:
由
pn=λnpn=λn有
(nk)pkn(1−pn)n−k=n(n−1)⋯(n−k+1)k!(λn)k(1−λn)n−k=λkkn(1−λn)−k(nk)pnk(1−pn)n−k=n(n−1)⋯(n−k+1)k!(λn)k(1−λn)n−k=λkkn(1−λn)−k
对任意固定的kk,当
n→∞
1⋅(1−1n)⋯(1−k−1n)→1,(1−λn)n→e−λ,(1−λn)−k→1.1⋅(1−1n)⋯(1−k−1n)→1,(1−λn)n→e−λ,(1−λn)−k→1.
故有:
limn→∞(nk)pkn(1−pn)n−k=λke−λk!limn→∞(nk)pnk(1−pn)n−k=λke−λk!
(IV)(IV)几何分布(离散)
如果XX的概率分布为P{X=k}=qk−1p(k=1,2⋯;0<p<1;q=1−p)则称XX服从参数为P的几何分布,记为X∼G(p)X∼G(p)
(V)(V)超几何分布(离散)
从一个有限总体中进行不放回抽样常会遇到超几何分布
设由NN个产品组成的总体,其中含有M个不合格品,若从中随机不放回地抽取nn个,其中含有不合格的产品个数X是一个离散型随机变量,假如n≤Mn≤M,则XX的可能取值为0,1,⋯,n;若XX可能取值0,1,⋯,M由古典方法
P{X=x}=CxMCn−xN−MCnN(*)(*)P{X=x}=CMxCN−Mn−xCNn
由组合等式
∑x=0rCxMCn−xN−M=CnN∑x=0rCMxCN−Mn−x=CNn
可以看出上述的概率之和为
11,即
∑rx=0P{X=x}=1故
∗∗式所表示的一组概率构成一个概率分布,这个分布称为
超几何分布
它含有三个参数
N,M,n记为
X∼H(n,N,M)X∼H(n,N,M)
数学期望
若
X∼H(n,N,M)X∼H(n,N,M),则数学期望为
E(X)=∑x=0rxCxMCn−xN−MCnN=nMN∑x=1rCx−1M−1Cn−xN−MCn−1N−1=nMNE(X)=∑x=0rxCMxCN−Mn−xCNn=nMN∑x=1rCM−1x−1CN−Mn−xCN−1n−1=nMN
当
n≪Nn≪N(即抽取个数
nn远远小于产品数
N)时,每次抽取后,总体中不合格品率
p=MNp=MN改变非常小,这时候的不放回抽样可以看成是放回抽样,这时候超几何分布可以用二项分布来近似。
随机变量的分布函数
设XX是一个随机变量,x是任意实数,函数
F(x)=P{X≤x},−∞<x<+∞F(x)=P{X≤x},−∞<x<+∞
称为XX的分布函数。
对于任意实数
x1,x2,(x1<x2),有
P{x1<X≤x2}=P{X≤x2}−P{X≤x1}=F(x2)−F(x1)(A)(A)P{x1<X≤x2}=P{X≤x2}−P{X≤x1}=F(x2)−F(x1)
因此如果已知
XX的
分布函数,我们就知道
X落在区间
(x1,x2](x1,x2]上的概率。
如果将
XX看成是数轴上的随机点的坐标,那么,分布函数
F(x)在
xx处的函数值就表示
X落在区间D
(−∞,x](−∞,x]上的概率。
分布函数
F(x)F(x)具有以下的基本性质:
1∘1∘:
F(x)F(x)是一个不减函数
事实上式(A)(A)对于任意的实数x1,x2(x1<x2)x1,x2(x1<x2),有
F(x2)−F(x1)=P{x1<X≤x2}≥0F(x2)−F(x1)=P{x1<X≤x2}≥0
2∘2∘:
0≤F(x)≤10≤F(x)≤1,且
F(−∞)=limx→−∞F(x)=0,F(∞)=limx→∞F(x)=1F(−∞)=limx→−∞F(x)=0,F(∞)=limx→∞F(x)=1
3∘3∘:
F(x+0)=F(x)F(x+0)=F(x)
连续型随机变量概率密度
如果对于随机变量XX的分布函数F(x),存在非负可积函数f(x)f(x),对于任意实数xx有
F(x)=∫x−∞f(t)dt
则称
XX为
连续型随机变量,
f(x)称为
XX的
概率密度函数,简称
概率密度
概率密度函数的性质:
1∘:f(x)≥0;f(x)≥0;
2∘2∘:∫+∞−∞f(x)dx=1∫−∞+∞f(x)dx=1
3∘3∘:对于任意实数x1,x2(x1≤x2)x1,x2(x1≤x2),P{x1<X≤x2}=F(x2)−F(x1)=∫x2x1f(x)dxP{x1<X≤x2}=F(x2)−F(x1)=∫x1x2f(x)dx
4∘4∘:若f(x)f(x)在点xx处连续,则有F′(x)=f(x)
若
f(x)f(x)具备性质
1∘,2∘1∘,2∘,引入
G(x)=∫x−∞f(t)dtG(x)=∫−∞xf(t)dt,它是某一随机变量
XX分布函数,
f(x)是
XX的概率密度。
三个重要的连续型随机变量
(VI)均匀分布(连续型)
若连续型随机变量XX具有概率密度
f(x)=⎧⎩⎨1b−a0,a<x<b,其他
则称
XX在区间
(a,b)上服从
均匀分布。记为
X∼U(a,b)X∼U(a,b)
分布函数
F(x)=⎧⎩⎨⎪⎪⎪⎪0x−ab−a1,x<a,a≤x<b,x≥bF(x)={0,x<ax−ab−a,a≤x<b1,x≥b
(VII)(VII)指数分布(连续型)
若连续型随机变量XX具有概率密度
f(x)=⎧⎩⎨1θe−x/θ0,x>0,其他
分布函数
F(x)={1−e−x/θ0,x>0,其他F(x)={1−e−x/θ,x>00,其他
无记忆性:
对于任意的s,t>0s,t>0,有
P{X>s+t∣X>s}=P{X>t}P{X>s+t∣X>s}=P{X>t}
P{X>s+t∣X>s}=P{(X>s+t)∩(X>s)}P{X>t}=P{X>s+t}P{X>t}=1−F(s+t)1−F(s)=e−(s+t)/θe−s/θ=e−t/θ=P{X>t}P{X>s+t∣X>s}=P{(X>s+t)∩(X>s)}P{X>t}=P{X>s+t}P{X>t}=1−F(s+t)1−F(s)=e−(s+t)/θe−s/θ=e−t/θ=P{X>t}
(VIII)(VIII)正态分布(连续型)
若连续型随机变量XX具有概率密度
f(x)=12π−−√σe−(x−μ)22σ2,−∞<x<+∞
其中
μ,σ(σ>0)μ,σ(σ>0)为常数,则称
XX服从参数为
μ,σ的
正态分布或
高斯分布,记为
X∼N(μ,σ2)X∼N(μ,σ2)
相关性质:
1∘1∘:曲线关于x=μx=μ对称,这表明对于任意h>0h>0有
P{μ−h<X≤μ}=P{μ<X≤μ+h}P{μ−h<X≤μ}=P{μ<X≤μ+h}
2∘2∘:当x=μx=μ时取到最大值
f(μ)=12π−−√σf(μ)=12πσ
分布函数
F(x)=12π−−√σ∫x−∞e−(t−μ)22σ2dtF(x)=12πσ∫−∞xe−(t−μ)22σ2dt
标准正态分布
特别当μ=0,σ=1μ=0,σ=1时称变量XX服从标准正态分布,其概率密度和分布函数分别用ϕ(x),Φ(x)表示,既有:
ϕ(x)=12π−−√e−x2/2Φ(x)=12π−−√∫x−∞e−t2/2dt容易得到:Φ(−x)=1−Φ(x)ϕ(x)=12πe−x2/2Φ(x)=12π∫−∞xe−t2/2dt容易得到:Φ(−x)=1−Φ(x)
引理:
若
X∼N(μ,σ2)X∼N(μ,σ2),则
Z=X−μσ∼N(0,1)Z=X−μσ∼N(0,1)
证:
P{Z≤x}令:t−μσ=u,得P{Z≤x}=P{X−μσ≤x}=P{X≤μ+σx}=12π−−√∫μ+σx−∞e−(t−μ)22σ2dt=12π−−√∫x−∞e−u2/2du=Φ(x)P{Z≤x}=P{X−μσ≤x}=P{X≤μ+σx}=12π∫−∞μ+σxe−(t−μ)22σ2dt令:t−μσ=u,得P{Z≤x}=12π∫−∞xe−u2/2du=Φ(x)