Gamma 分布的特性
1. 概率密度函数
若随机变量
X
X
X 服从参数为
α
>
0
\alpha>0
α>0(形状参数)和
β
>
0
\beta > 0
β>0(速率参数)的 Gamma 分布,记为
X
∼
Γ
(
α
,
β
)
X\sim \Gamma(\alpha,\beta)
X∼Γ(α,β),其概率密度函数为:
f
(
x
)
=
β
α
Γ
(
α
)
x
α
−
1
e
−
β
x
,
x
>
0
f(x)=\frac{\beta^{\alpha}}{\Gamma(\alpha)}x^{\alpha - 1}e^{-\beta x},x > 0
f(x)=Γ(α)βαxα−1e−βx,x>0
其中
Γ
(
α
)
=
∫
0
∞
t
α
−
1
e
−
t
d
t
\Gamma(\alpha)=\int_{0}^{\infty}t^{\alpha - 1}e^{-t}dt
Γ(α)=∫0∞tα−1e−tdt 是 Gamma 函数。当
α
\alpha
α 为正整数时,
Γ
(
α
)
=
(
α
−
1
)
!
\Gamma(\alpha)=(\alpha - 1)!
Γ(α)=(α−1)!
2. 图像特征
形状参数 α \alpha α 的影响
- 当 α < 1 \alpha < 1 α<1 时,概率密度函数 f ( x ) f(x) f(x) 在 x = 0 x = 0 x=0 处趋近于正无穷,并且随着 x x x 的增大而单调递减。
- 当 α = 1 \alpha = 1 α=1 时,Gamma 分布退化为指数分布,其概率密度函数为 f ( x ) = β e − β x , x > 0 f(x)=\beta e^{-\beta x},x>0 f(x)=βe−βx,x>0,呈单调递减的形状。
- 当
α
>
1
\alpha> 1
α>1 时,概率密度函数先增后减,存在一个众数(即概率密度函数取得最大值的点),众数为
α
−
1
β
\frac{\alpha - 1}{\beta}
βα−1。
速率参数 β \beta β 的影响
β
\beta
β 越大,概率密度函数的图像越集中在
x
=
0
x = 0
x=0 附近;
β
\beta
β 越小,图像越分散。
3. 数字特征
期望
若 X ∼ Γ ( α , β ) X\sim\Gamma(\alpha,\beta) X∼Γ(α,β),则 E ( X ) = α β E(X)=\frac{\alpha}{\beta} E(X)=βα。可以通过对 x ⋅ f ( x ) x\cdot f(x) x⋅f(x) 在 ( 0 , + ∞ ) (0,+\infty) (0,+∞) 上积分得到,即 E ( X ) = ∫ 0 ∞ x ⋅ β α Γ ( α ) x α − 1 e − β x d x E(X)=\int_{0}^{\infty}x\cdot\frac{\beta^{\alpha}}{\Gamma(\alpha)}x^{\alpha - 1}e^{-\beta x}dx E(X)=∫0∞x⋅Γ(α)βαxα−1e−βxdx,经过一系列积分运算可得出结果。
方差
D ( X ) = α β 2 D(X)=\frac{\alpha}{\beta^{2}} D(X)=β2α。方差衡量了随机变量取值的分散程度,通过 D ( X ) = E ( X 2 ) − [ E ( X ) ] 2 D(X)=E(X^{2})-[E(X)]^{2} D(X)=E(X2)−[E(X)]2 计算,其中 E ( X 2 ) = ∫ 0 ∞ x 2 ⋅ β α Γ ( α ) x α − 1 e − β x d x E(X^{2})=\int_{0}^{\infty}x^{2}\cdot\frac{\beta^{\alpha}}{\Gamma(\alpha)}x^{\alpha - 1}e^{-\beta x}dx E(X2)=∫0∞x2⋅Γ(α)βαxα−1e−βxdx。
4. 特殊情况
指数分布
当 α = 1 \alpha = 1 α=1 时,Gamma 分布 Γ ( 1 , β ) \Gamma(1,\beta) Γ(1,β) 就是参数为 β \beta β 的指数分布,指数分布常用于描述独立随机事件发生的时间间隔。
卡方分布
当 α = n 2 \alpha=\frac{n}{2} α=2n, β = 1 2 \beta=\frac{1}{2} β=21 时,Gamma 分布 Γ ( n 2 , 1 2 ) \Gamma(\frac{n}{2},\frac{1}{2}) Γ(2n,21) 就是自由度为 n n n 的卡方分布 χ 2 ( n ) \chi^{2}(n) χ2(n),卡方分布在假设检验、方差分析等统计推断中有着重要应用。
5. 可加性
若 X 1 ∼ Γ ( α 1 , β ) X_1\sim\Gamma(\alpha_1,\beta) X1∼Γ(α1,β), X 2 ∼ Γ ( α 2 , β ) X_2\sim\Gamma(\alpha_2,\beta) X2∼Γ(α2,β),且 X 1 X_1 X1 与 X 2 X_2 X2 相互独立,则 X 1 + X 2 ∼ Γ ( α 1 + α 2 , β ) X_1 + X_2\sim\Gamma(\alpha_1+\alpha_2,\beta) X1+X2∼Γ(α1+α2,β)。一般地,若 X 1 , X 2 , ⋯ , X n X_1,X_2,\cdots,X_n X1,X2,⋯,Xn 相互独立,且 X i ∼ Γ ( α i , β ) X_i\sim\Gamma(\alpha_i,\beta) Xi∼Γ(αi,β), i = 1 , 2 , ⋯ , n i = 1,2,\cdots,n i=1,2,⋯,n,则 ∑ i = 1 n X i ∼ Γ ( ∑ i = 1 n α i , β ) \sum_{i = 1}^{n}X_i\sim\Gamma(\sum_{i = 1}^{n}\alpha_i,\beta) ∑i=1nXi∼Γ(∑i=1nαi,β)。
6. 矩生成函数
随机变量 X ∼ Γ ( α , β ) X\sim\Gamma(\alpha,\beta) X∼Γ(α,β) 的矩生成函数为 M X ( t ) = ( 1 − t β ) − α M_X(t)=(1-\frac{t}{\beta})^{-\alpha} MX(t)=(1−βt)−α,其中 t < β t < \beta t<β。矩生成函数可以用来方便地计算随机变量的各阶矩,通过对矩生成函数求导并在 t = 0 t = 0 t=0 处取值,即可得到相应阶数的矩。例如,一阶导数 M X ′ ( t ) M_X^\prime(t) MX′(t) 在 t = 0 t = 0 t=0 处的值就是期望 E ( X ) E(X) E(X)。
7. 与其他分布的关系
与泊松分布的关系
Gamma 分布与泊松过程紧密相关。在泊松过程中,第 n n n 个事件发生的时间 T n T_n Tn 服从参数为 α = n \alpha=n α=n 和 β = λ \beta=\lambda β=λ 的 Gamma 分布,其中 λ \lambda λ 是泊松过程的速率。
与贝塔分布的关系
如果 X ∼ Γ ( α 1 , β ) X\sim\Gamma(\alpha_1,\beta) X∼Γ(α1,β), Y ∼ Γ ( α 2 , β ) Y\sim\Gamma(\alpha_2,\beta) Y∼Γ(α2,β),且 X X X 与 Y Y Y 相互独立,那么 X X + Y \frac{X}{X + Y} X+YX 服从参数为 α 1 \alpha_1 α1 和 α 2 \alpha_2 α2 的贝塔分布 B ( α 1 , α 2 ) B(\alpha_1,\alpha_2) B(α1,α2)。