概率论总结——泊松分布与指数分布
泊松分布 P ( λ ) P(\lambda) P(λ)
定义
如果随机分布
X
X
X 有如下的概率分布:
P
(
X
=
k
)
=
λ
k
k
!
e
−
λ
,
k
=
0
,
1
,
⋯
P(X=k)=\frac{\lambda^k}{k!}e^{-\lambda},k=0,1,\cdots
P(X=k)=k!λke−λ,k=0,1,⋯
则称
X
X
X 服从参数为
λ
\lambda
λ 的泊松分布,简记为
X
∼
P
(
λ
)
X\sim P(\lambda)
X∼P(λ) ,
λ
\lambda
λ 为正常数。
实际例子
1910年,著名科学家卢瑟福和盖格观察了放射性物质钋放射 α \alpha α 粒子的情况,他们进行了 N = 2608 N=2608 N=2608 次观测, 每次观测7.5秒,一共观测到10094个 α \alpha α 粒子放出。观测记录表明,**每7.5秒中放射出 α \alpha α 粒子的个数 X X X 近似服从泊松分布 P ( 3.87 ) P(3.87) P(3.87) **,3.87是7.5秒中放射出粒子的平均数。
可证明: X ∼ P ( λ ) X\sim P(\lambda) X∼P(λ) .设想将 t = 7.5 t=7.5 t=7.5 秒等分成 n n n 段,每段是 δ n = t / n \delta_n=t/n δn=t/n 秒,对充分大的 n n n 假定:
(1)在 δ n \delta_n δn 内最多只有一个 α \alpha α 粒子放出,并且放出一个粒子的概率 p n = μ δ n = μ t / n p_n=\mu\delta_n=\mu t/n pn=μδn=μt/n , μ \mu μ 是正常数;
(2)各小时间段内是否放射出 α \alpha α 粒子相互独立.
在以上假定下,放射出的粒子数
X
X
X 服从
B
(
n
,
p
n
)
B(n,p_n)
B(n,pn) ,于是:
P
(
X
=
k
)
=
lim
n
→
∞
C
n
k
p
n
k
(
1
−
p
n
)
n
−
k
=
lim
n
→
∞
n
!
k
!
(
n
−
k
)
!
(
μ
t
n
)
k
(
1
−
μ
t
n
)
n
−
k
=
lim
n
→
∞
(
μ
t
)
k
k
!
n
(
n
−
1
)
⋯
(
n
−
k
+
1
)
n
k
(
1
−
μ
t
n
)
n
−
k
=
(
μ
t
)
k
k
!
e
−
μ
t
\begin{aligned}P(X=k) & =\lim_{n\rightarrow\infty}C_n^kp_n^k(1-p_n)^{n-k}\\&=\lim_{n\rightarrow\infty}\frac{n!}{k!(n-k)!}(\frac{\mu t}{n})^k(1-\frac{\mu t}{n})^{n-k}\\&=\lim_{n\rightarrow\infty}\frac{(\mu t)^k}{k!}\frac{n(n-1)\cdots(n-k+1)}{n^k}(1-\frac{\mu t}{n})^{n-k}\\&=\frac{(\mu t)^k}{k!}e^{-\mu t}\end{aligned}
P(X=k)=n→∞limCnkpnk(1−pn)n−k=n→∞limk!(n−k)!n!(nμt)k(1−nμt)n−k=n→∞limk!(μt)knkn(n−1)⋯(n−k+1)(1−nμt)n−k=k!(μt)ke−μt
取
λ
=
μ
t
\lambda=\mu t
λ=μt ,得
X
∼
P
(
λ
)
X\sim P(\lambda)
X∼P(λ) .
该例子实际验证了二项分布向泊松分布趋近的事实;如果 n n n 很大, p p p 很小,就可以用泊松分布来描述二项分布 B ( n , p ) B(n,p) B(n,p) 。
泊松分布可以描述许多有类似背景的随机现象,例如某段高速公路上一年内的交通事故数,某市场一天中到达的顾客次数(排队论),某办公室一天中收到的电话数,某大学一天中上课迟到的总人数等等。
期望与方差
如果随机变量
X
∼
P
(
λ
)
X\sim P(\lambda)
X∼P(λ) ,则其期望与方差分别为:
E
(
X
)
=
λ
V
a
r
(
X
)
=
λ
E(X)=\lambda\\ Var(X)=\lambda
E(X)=λVar(X)=λ
指数分布 E ( λ ) E(\lambda) E(λ)
定义
对正常数
λ
\lambda
λ ,如果随机变量
X
X
X 的概率密度是
f
(
x
)
=
{
λ
e
−
λ
x
,
x
≥
0
0
,
x
<
0
f(x)=\begin{cases}\lambda e^{-\lambda x},&x\geq0\\0,&x<0\end{cases}
f(x)={λe−λx,0,x≥0x<0
就称
X
X
X 服从参数为
λ
\lambda
λ 的指数分布,记作
X
∼
E
(
λ
)
X\sim E(\lambda)
X∼E(λ) 。
无后效性
定理:设
X
X
X 是连续型非负随机变量,则
X
X
X 服从指数分布的充要条件是对任何
s
,
t
≥
0
s,t\geq0
s,t≥0,有
P
(
X
>
s
+
t
∣
X
>
s
)
=
P
(
X
>
t
)
P(X>s+t|X>s)=P(X>t)
P(X>s+t∣X>s)=P(X>t)
上性质称为无后效性,无后效性是指数分布的特征。
如果 X X X 表示某仪器的工作寿命,无后效性的解释是:当仪器工作了 s s s 小时后再继续工作 t t t 小时的概率等于该仪器刚开始就能工作 t t t 小时的概率,说明该仪器的使用寿命不随使用时间的增加发生变化,即仪器是“永葆青春”的。
一般来说,电子元件和计算机软件等具备这种性质,青花盘的使用寿命也具有无后效性。
定理的证明:略
实际例子
用 X 1 X_1 X1 表示 α \alpha α 粒子实验中从开始到观测到第一个 α \alpha α 粒子的等待时间,可以证明 X 1 X_1 X1 服从指数分布。
用
N
(
t
)
N(t)
N(t) 表示时间段
(
0
,
t
]
(0,t]
(0,t] 内观测到的
α
\alpha
α 粒子数,按照之前推导,
N
(
t
)
∼
P
(
μ
t
)
N(t)\sim P(\mu t)
N(t)∼P(μt) ,其中
μ
\mu
μ 是正常数。于是
P
(
X
1
>
t
)
=
P
(
N
(
t
)
=
0
)
=
e
−
μ
t
P(X_1>t)=P(N(t)=0)=e^{-\mu t}
P(X1>t)=P(N(t)=0)=e−μt
所以,对任何
0
≤
a
<
b
0\leq a<b
0≤a<b ,有
P
(
a
<
X
1
≤
b
)
=
P
(
X
1
>
a
)
−
P
(
X
1
>
b
)
=
e
−
μ
a
−
e
−
μ
b
=
∫
a
b
μ
e
−
μ
x
d
x
P(a<X_1\leq b)=P(X_1>a)-P(X_1>b)=e^{-\mu a}-e^{-\mu b}=\int_a^b \mu e^{-\mu x}dx
P(a<X1≤b)=P(X1>a)−P(X1>b)=e−μa−e−μb=∫abμe−μxdx
因此
f
(
x
)
=
{
λ
e
−
λ
x
,
x
≥
0
0
,
x
<
0
f(x)=\begin{cases}\lambda e^{-\lambda x},&x\geq0\\0,&x<0\end{cases}
f(x)={λe−λx,0,x≥0x<0 是
X
1
X_1
X1 的概率密度。
可以想象,如果 X 2 X_2 X2 是从观测到第一个 α \alpha α 粒子开始到观测到第二个 α \alpha α 粒子的间隔时间, X 2 X_2 X2 也应当服从指数分布。
期望与方差
如果随机变量
X
∼
E
(
λ
)
X\sim E(\lambda)
X∼E(λ) ,则其期望与方差分别为:
E
(
X
)
=
1
/
λ
V
a
r
(
X
)
=
1
/
λ
2
E(X)=1/\lambda\\ Var(X)=1/\lambda^2
E(X)=1/λVar(X)=1/λ2