GammaGammaGamma分布
如果一个随机变量YYY服从Ga(α,β)(α>0,β>0)Ga(\alpha,\beta)(\alpha>0,\beta>0)Ga(α,β)(α>0,β>0),它的密度函数如下:
f(y)={βαΓ(α)yα−1e−βy,(x≥0) 0, (x<0)f(y)=\left\{
\begin{aligned}
\frac{\beta^\alpha}{\Gamma(\alpha)}y^{\alpha-1}e^{-\beta{y}},(x\geq0)\\
~0,~~~~~~~~~~~(x<0)
\end{aligned}
\right.
f(y)=⎩⎪⎨⎪⎧Γ(α)βαyα−1e−βy,(x≥0) 0, (x<0)
其中,Γ(α)=∫0+∞tα−1e−tdt\Gamma(\alpha)=\int_0^{+\infty}t^{\alpha-1}e^{-t}dtΓ(α)=∫0+∞tα−1e−tdt.
1. PoissonPoissonPoisson分布
前面说过,BetaBetaBeta分布是二项分布中参数θ\thetaθ的共轭先验分布族;同样的, GmmaGmmaGmma分布族是PoissonPoissonPoisson分布中参数λ\lambdaλ的共轭先验分布族,下面给出证明:
随机变量XXX服从参数为λ\lambdaλ的PoissonPoissonPoisson分布,即XXX~P(λ)P(\lambda)P(λ),那么XXX的分布列为:
P(X=k)=e−λλkk!(λ>0).P(X=k)=\frac{e^{-\lambda}\lambda^k}{k!}(\lambda>0).P(X=k)=k!e−λλk(λ>0).
使用贝叶斯方法对λ\lambdaλ的值进行参数估计,将参数λ\lambdaλ视为一个随机变量,随机变量λ\lambdaλ的先验分布服从GammaGammaGamma分布,其密度函数为:
π(λ)=βαΓ(α)λα−1e−βλ=βαλα−1e−βλ∫0+∞tα−1e−tdt(α>0,β>0).\pi(\lambda)=\frac{\beta^\alpha}{\Gamma(\alpha)}\lambda^{\alpha-1}e^{-\beta\lambda}=\frac{\beta^\alpha\lambda^{\alpha-1}e^{-\beta\lambda}}{\int_0^{+\infty}t^{\alpha-1}e^{-t}dt}(\alpha>0,\beta>0).π(λ)=Γ(α)βαλα−1e−βλ=∫0+∞tα−1e−tdtβαλα−1e−βλ(α>0,β>0).
为了使用样本信息对参数进行估计,从总体XXX中随机抽取nnn个样本,记为(x1,x2,...,xn)=x(x_1,x_2,...,x_n)=x(x1,x2,...,xn)=x, 那么可以写出似然函数:
L(x∣λ)=∏i=0ne−λλxixi!=e−nλλnx‾∏i=0n(xi!).L(x|\lambda)=\prod\limits_{i=0}^n\frac{e^{-\lambda}\lambda^{x_i}}{x_i!}=\frac{e^{-n\lambda}\lambda^{n\overline{x}}}{\prod\limits_{i=0}^n(x_i!)}.L(x∣λ)=i=0∏nxi!e−λλxi=i=0∏n(xi!)e−nλλnx.
根据以上两个式子 — 先验密度函数和似然函数,可以根据贝叶斯公式得出参数λ\lambdaλ的后验概率密度:
π(λ∣x)=L(x∣λ)π(λ)∫ΛL(x∣λ)π(λ)dλ=e−nλλnx‾∏i=0n(xi!)βαλα−1e−βλ∫0+∞tα−1e−tdt∫0+∞e−nλλnx‾∏i=0n(xi!)βαλα−1e−βλ∫0+∞tα−1e−tdtdλ\pi(\lambda|x)=\frac{L(x|\lambda)\pi(\lambda)}{\int_\Lambda L(x|\lambda)\pi(\lambda)d\lambda}=\frac{\frac{e^{-n\lambda}\lambda^{n\overline{x}}}{\prod\limits_{i=0}^n(x_i!)}\frac{\beta^\alpha\lambda^{\alpha-1}e^{-\beta\lambda}}{\int_0^{+\infty}t^{\alpha-1}e^{-t}dt}}{\int_0^{+\infty}\frac{e^{-n\lambda}\lambda^{n\overline{x}}}{\prod\limits_{i=0}^n(x_i!)}\frac{\beta^\alpha\lambda^{\alpha-1}e^{-\beta\lambda}}{\int_0^{+\infty}t^{\alpha-1}e^{-t}dt}d\lambda}
π(λ∣x)=∫ΛL(x∣λ)π(λ)dλL(x∣λ)π(λ)=∫0+∞i=0∏n(xi!)e−nλλnx∫0+∞tα−1e−tdtβαλα−1e−βλdλi=0∏n(xi!)e−nλλnx∫0+∞tα−1e−tdtβαλα−1e−βλ =λnx‾+α−1e−(n+β)λ∫0+∞λnx‾+α−1e−(n+β)λdλ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~=\frac{\lambda^{n\overline{x}+\alpha-1}e^{-(n+\beta)\lambda}}{\int_0^{+\infty}\lambda^{n\overline{x}+\alpha-1}e^{-(n+\beta)\lambda}d\lambda} =∫0+∞λnx+α−1e−(n+β)λdλλnx+α−1e−(n+β)λ
(令(n+β)λ=t) =λnx‾+α−1e−(n+β)λ∫0+∞1n+β(tn+β)nx‾+α−1e−tdt~~~~~~~~~~~~~~~(令(n+\beta)\lambda=t)~~~~~~=\frac{\lambda^{n\overline{x}+\alpha-1}e^{-(n+\beta)\lambda}}{\int_0^{+\infty}\frac{1}{n+\beta}(\frac{t}{n+\beta})^{n\overline{x}+\alpha-1}e^{-t}dt} (令(n+β)λ=t) =∫0+∞n+β1(n+βt)nx+α−1e−tdtλnx+α−1e−(n+β)λ
=(n+β)nx‾+αλnx‾+α−1e−(n+β)λΓ(nx‾+α),~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~=(n+\beta)^{n\overline{x}+\alpha}\frac{\lambda^{n\overline{x}+\alpha-1}e^{-(n+\beta)\lambda}}{\Gamma(n\overline{x}+\alpha)}, =(n+β)nx+αΓ(nx+α)λnx+α−1e−(n+β)λ,
即 λ∣x\lambda|xλ∣x ~ Ga(nx‾+α,n+β)Ga({n\overline{x}+\alpha},n+\beta)Ga(nx+α,n+β). 由此可直观地看出用贝叶斯原理可以将样本信息与参数的先验分布信息有效地结合起来,得出参数的后验估计。
2. 指数分布
前面指出,当随机变量YYY~ Beta(1,1)Beta(1,1)Beta(1,1)时, BetaBetaBeta分布退化为均匀分布,YYY~ U(0,1)U(0,1)U(0,1).其实,当随机变量 YYY~ Ga(1,β)Ga(1,\beta)Ga(1,β)时,GammaGammaGamma分布退化为指数分布,YYY ~ exp(β)exp(\beta)exp(β).
当一个随机变量XXX ~ exp(λ)exp(\lambda)exp(λ)时,它的密度函数为:
f(x)={λe−λx, (x≥0)0, (x<0). f(x)=\left\{
\begin{aligned}
\lambda e^{-\lambda x},~~~(x\geq0)\\
0,~~~~~~~(x<0)
\end{aligned}
\right..
f(x)={λe−λx, (x≥0)0, (x<0).
实际上,运用贝叶斯的思想,将参数λ\lambdaλ不看作一个固定的常数,而是一个服从某种分布的随机变量,就会发现,GmmaGmmaGmma分布族也是指数分布中参数λ\lambdaλ的共轭先验分布族,下面给出证明:
从总体XXX中随机抽取nnn个样本,记为(x1,x2,...,xn)=x(x_1,x_2,...,x_n)=x(x1,x2,...,xn)=x, 那么可以写出似然函数:
L(x∣λ)=∏i=0nλe−λxi=λne−λnx‾.L(x|\lambda)=\prod\limits_{i=0}^n{\lambda e^{-\lambda{x_i}}}=\lambda^ne^{-\lambda n\overline{x}}.L(x∣λ)=i=0∏nλe−λxi=λne−λnx.
依旧将参数λ\lambdaλ视为一个随机变量,随机变量λ\lambdaλ的先验分布服从GammaGammaGamma分布,其密度函数为:
π(λ)=βαΓ(α)λα−1e−βλ=βαλα−1e−βλ∫0+∞tα−1e−tdt (λ≥0).\pi(\lambda)=\frac{\beta^\alpha}{\Gamma(\alpha)}\lambda^{\alpha-1}e^{-\beta\lambda}=\frac{\beta^\alpha\lambda^{\alpha-1}e^{-\beta\lambda}}{\int_0^{+\infty}t^{\alpha-1}e^{-t}dt}~~(\lambda\geq0).π(λ)=Γ(α)βαλα−1e−βλ=∫0+∞tα−1e−tdtβαλα−1e−βλ (λ≥0).
根据以上两个式子 — 先验密度函数和似然函数,可以根据贝叶斯公式得出参数λ\lambdaλ的后验概率密度:
π(λ∣x)=L(x∣λ)π(λ)∫ΛL(x∣λ)π(λ)dλ=λne−λnx‾βαΓ(α)λα−1e−βλ∫0+∞λne−λnx‾βαΓ(α)λα−1e−βλdλ\pi(\lambda|x)=\frac{L(x|\lambda)\pi(\lambda)}{\int_\Lambda L(x|\lambda)\pi(\lambda)d\lambda}=\frac{\lambda^ne^{-\lambda n\overline{x}}\frac{\beta^\alpha}{\Gamma(\alpha)}\lambda^{\alpha-1}e^{-\beta\lambda}}{\int_0^{+\infty}\lambda^ne^{-\lambda n\overline{x}}\frac{\beta^\alpha}{\Gamma(\alpha)}\lambda^{\alpha-1}e^{-\beta\lambda}d\lambda}π(λ∣x)=∫ΛL(x∣λ)π(λ)dλL(x∣λ)π(λ)=∫0+∞λne−λnxΓ(α)βαλα−1e−βλdλλne−λnxΓ(α)βαλα−1e−βλ
=λn+α−1e−(nx‾+β)λ∫0+∞λn+α−1e−(nx‾+β)λdλ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~=\frac{\lambda^{n+\alpha-1}e^{-(n\overline{x}+\beta)\lambda}}{\int_0^{+\infty}\lambda^{n+\alpha-1}e^{-(n\overline{x}+\beta)\lambda}d\lambda} =∫0+∞λn+α−1e−(nx+β)λdλλn+α−1e−(nx+β)λ
(令(nx‾+β)λ=t) =(nx‾+β)n+αλn+α−1e−(nx‾+β)λ∫0+∞tn+α−1e−tdt(令(n\overline{x}+\beta)\lambda=t)~~~~~~~~~~~~~~~=(n\overline{x}+\beta)^{n+\alpha} \frac{\lambda^{n+\alpha-1}e^{-(n\overline{x}+\beta)\lambda}}{\int_0^{+\infty}t^{n+\alpha-1}e^{-t}dt}(令(nx+β)λ=t) =(nx+β)n+α∫0+∞tn+α−1e−tdtλn+α−1e−(nx+β)λ
=(nx‾+β)n+αλn+α−1e−(nx‾+β)λΓ(n+α)~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~=(n\overline{x}+\beta)^{n+\alpha} \frac{\lambda^{n+\alpha-1}e^{-(n\overline{x}+\beta)\lambda}}{\Gamma(n+\alpha)} =(nx+β)n+αΓ(n+α)λn+α−1e−(nx+β)λ
即 λ∣x\lambda|xλ∣x ~ Ga(n+α,nx‾+β)Ga({n+\alpha},n\overline{x}+\beta)Ga(n+α,nx+β). 由此可直观地看出用贝叶斯原理可以将样本信息与参数的先验分布信息有效地结合起来,得出参数的后验估计。