文章目录
Chapter 4:其他常用分布与分布族
一、 B \Beta B 分布
Part 1: B \Beta B 函数
类似于上一节中我们学习 Γ \Gamma Γ 分布的过程,在介绍 B \Beta B 分布之前,我们先来回顾一下在数学分析中学过的 B \Beta B 函数。首先给出 B \Beta B 分布的定义:
B ( P , Q ) = ∫ 0 1 x P − 1 ( 1 − x ) Q − 1 d x . \Beta(P,Q)=\int_0^1x^{P-1}(1-x)^{Q-1}{\rm d}x \ . B(P,Q)=∫01xP−1(1−x)Q−1dx .
其中 B ( P , Q ) \Beta(P,Q) B(P,Q) 的定义域为 P > 0 , Q > 0 P>0,\,Q>0 P>0,Q>0 ,原因是在此定义域范围内,反常积分收敛。利用 B \Beta B 函数的定义式,可以得到 B \Beta B 函数具有很好的性质,以及实用的递推公式,特别需要注意的是 Γ \Gamma Γ 函数和 B \Beta B 函数之间的关系。
- 连续性: B \Beta B 函数在定义域 P > 0 , Q > 0 P>0,\,Q>0 P>0,Q>0 内连续。
- 对称性: B ( P , Q ) = B ( Q , P ) \Beta(P,Q)=\Beta(Q,P) B(P,Q)=B(Q,P) 。
- 递推公式:
B ( P , Q ) = Q − 1 P + Q − 1 B ( P , Q − 1 ) , P > 0 , Q > 1 . B ( P , Q ) = P − 1 P + Q − 1 B ( P − 1 , Q ) , P > 1 , Q > 0 . B ( P , Q ) = ( P − 1 ) ( Q − 1 ) ( P + Q − 1 ) ( P + Q − 2 ) B ( P − 1 , Q − 1 ) , P > 1 , Q > 1 . \begin{aligned} &\Beta(P,Q)=\frac{Q-1}{P+Q-1}\Beta(P,Q-1) \ , \quad P>0,\,Q>1 \ . \\ &\Beta(P,Q)=\frac{P-1}{P+Q-1}\Beta(P-1,Q) \ , \quad P>1,\,Q>0 \ . \\ &\Beta(P,Q)=\frac{(P-1)(Q-1)}{(P+Q-1)(P+Q-2)}\Beta(P-1,Q-1) \ , \quad P>1,\,Q>1 \ . \\ \end{aligned} B(P,Q)=P+Q−1Q−1B(P,Q−1) ,P>0,Q>1 .B(P,Q)=P+Q−1P−1B(P−1,Q) ,P>1,Q>0 .B(P,Q)=(P+Q−1)(P+Q−2)(P−1)(Q−1)B(P−1,Q−1) ,P>1,Q>1 .
- 与 Γ \Gamma Γ 函数的关系:对于任意的正实数 P , Q P,Q P,Q ,有关系表达式: B ( P , Q ) = Γ ( P ) Γ ( Q ) Γ ( P + Q ) \Beta(P,Q)=\dfrac{\Gamma(P)\Gamma(Q)}{\Gamma(P+Q)} B(P,Q)=Γ(P+Q)Γ(P)Γ(Q) 。
利用与 Γ \Gamma Γ 函数的关系,当 P P P 和 Q Q Q 趋近于无穷时,我们有
B ( P , Q ) ∼ 2 π P P − 1 2 Q Q − 1 2 ( P + Q ) P + Q − 1 2 . \Beta(P,Q)\sim\frac{\sqrt{2\pi}P^{P-\frac12}Q^{Q-\frac12}}{(P+Q)^{P+Q-\frac12}} \ . B(P,Q)∼(P+Q)P+Q−212πPP−21QQ−21 .
所以当 P P P 和 Q Q Q 充分大时,我们也可以用 Stirling 公式来近似计算 B \Beta B 函数值。
Part 2: B \Beta B 分布的定义和性质
具有下列密度函数的分布称为 B \Beta B 分布:
p ( x ; a , b ) = Γ ( a + b ) Γ ( a ) Γ ( b ) x a − 1 ( 1 − x ) b − 1 , 0 < x < 1 . p(x;a,b)=\frac{\Gamma(a+b)}{\Gamma(a)\Gamma(b)}x^{a-1}(1-x)^{b-1} \ , \quad 0<x<1 \ . p(x;a,b)=Γ(a)Γ(b)Γ(a+b)xa−1(1−x)b−1 ,0<x<1 .
其中 a > 0 , b > 0 a>0,\,b>0 a>0,b>0 称为形状参数。
上述密度函数的定义式是用 Γ \Gamma Γ 函数来表示的,如果利用 B \Beta B 函数与 Γ \Gamma Γ 函数的关系,可以将 B \Beta B 分布的密度函数写为:
p ( x ; a , b ) = 1 B ( a , b ) x a − 1 ( 1 − x ) b − 1 , 0 < x < 1 . p(x;a,b)=\frac{1}{\Beta(a,b)}x^{a-1}(1-x)^{b-1} \ , \quad 0<x<1 \ . p(x;a,b)=B(a,b)1xa−1(1−x)b−1 ,0<x<1 .
为了便于区分,我们常用 B e ( a , b ) {\rm Be}(a,b) Be(a,b) 或 β ( a , b ) \beta(a,b) β(a,b) 来表示 B \Beta B 分布。接下来,我们不会像 Γ \Gamma Γ 分布那样对 B \Beta B 分布的各种性质进行展开介绍和计算推导,这里我们介绍几条常用的性质。
B \Beta B 分布的 k k k 阶矩:
E ( X k ) = ∫ 0 1 1 B ( a , b ) x a − 1 + k ( 1 − x ) b − 1 d x = B ( a + k , b ) B ( a , b ) = Γ ( a + k ) Γ ( a + b ) Γ ( a + k + b ) Γ ( a ) . \begin{aligned} {\rm E}\left(X^k\right)=\int_0^1\frac{1}{\Beta(a,b)}x^{a-1+k}(1-x)^{b-1}{\rm d}x =\frac{\Beta(a+k,b)}{\Beta(a,b)}=\frac{\Gamma(a+k)\Gamma(a+b)}{\Gamma(a+k+b)\Gamma(a)} \ . \end{aligned} E(Xk)=∫01B(a,b)1xa−1+k(1−x)b−1dx=B(a,b)B(a+k,b)=Γ(a+k+b)Γ(a)Γ(a+k)Γ(a+b) .
B \Beta B 分布的均值和方差:
E ( X ) = Γ ( a + 1 ) Γ ( a + b ) Γ ( a + 1 + b ) Γ ( a ) = a a + b , E ( X 2 ) = Γ ( a + 2 ) Γ ( a + b ) Γ ( a + 2 + b ) Γ ( a ) = a ( a + 1 ) ( a + b ) ( a + b + 1 ) , V a r ( X ) = E ( X 2 ) − [ E ( X ) ] 2 = a ( a + 1 ) ( a + b ) ( a + b + 1 ) − ( a a + b ) 2 = a b ( a + b ) 2 ( a + b + 1 ) . \begin{aligned} &{\rm E}(X)=\frac{\Gamma(a+1)\Gamma(a+b)}{\Gamma(a+1+b)\Gamma(a)}=\frac{a}{a+b} \ , \quad {\rm E}\left(X^2\right)=\frac{\Gamma(a+2)\Gamma(a+b)}{\Gamma(a+2+b)\Gamma(a)}=\frac{a(a+1)}{(a+b)(a+b+1)} \ , \\ \\ &{\rm Var}(X)={\rm E}\left(X^2\right)-[{\rm E}(X)]^2=\frac{a(a+1)}{(a+b)(a+b+1)}-\left(\frac{a}{a+b}\right)^2=\frac{ab}{(a+b)^2(a+b+1)} \ . \end{aligned} E(X)=Γ(a+1+b)Γ(a)Γ(a+1)Γ(a+b)=a+ba ,E(X2)=Γ(a+2+b)Γ(a)Γ(a+2)Γ(a+b)=(a+b)(a+b+1)a(a+1) ,Var(X)=E(X2)−[E(X)]2=(a+b)(a+b+1)a(a+1)−(a+ba)2=(a+b)2(a+b+1)ab .
特别地,当 a = b = 1 a=b=1 a=b=1 时, B ( 1 , 1 ) \Beta(1,1) B(1,1) 即为区间 [ 0 , 1 ] [0,1] [0,1] 上的均匀分布 U ( 0 , 1 ) U(0,1) U(0,1) 。
Part 3:均匀分布的次序统计量
在这里,我们要讨论一个重要的性质:区间 [ 0 , 1 ] [0,1] [0,1] 上的均匀分布 U ( 0 , 1 ) U(0,1) U(0,1) 的次序统计量是服从 B \Beta B 分布的。具体的参数我们在接下来的计算中逐步揭晓。首先回顾一下 U (