1、二项分布与β\betaβ分布
1.1 二项分布
随机变量XXX可取的值为{0,1}\{0,1\}{0,1},XXX取1的概率为ppp,取0的概率为1−p1-p1−p。进行nnn次随机试验,XXX取1的次数为kkk:
P(X=k)=Cnkpk(1−p)n−kP(X=k)=C_{n}^{k}p^{k}(1-p)^{n-k}P(X=k)=Cnkpk(1−p)n−k
1.2 β\betaβ分布
f(x)=1B(α,β)xα−1(1−x)β−1,x∈[0,1]f(x) = \frac{1}{B(\alpha,\beta)}x^{\alpha-1}(1-x)^{\beta-1},x\in[0,1]f(x)=B(α,β)1xα−1(1−x)β−1,x∈[0,1]
其中,B(α,β)=Γ(α)Γ(β)Γ(α+β)B(\alpha,\beta)=\frac{\Gamma(\alpha)\Gamma(\beta)}{\Gamma(\alpha+\beta)}B(α,β)=Γ(α+β)Γ(α)Γ(β)
可以看出二项分布和β\betaβ分布形式相同,之前系数不同。
2、共轭分布
- p(θ)p(\theta)p(θ) 先验分布 不需要知道变量x时,θ的分布律\theta的分布律θ的分布律
- p(θ∣x)p(\theta|x)p(θ∣x) 后验分布 在知道x的情况下,θ的分布律\theta的分布律θ的分布律
- p(x∣θ)p(x|\theta)p(x∣θ) 似然概率
根据贝叶斯概率公式有:
p(θ∣x)=p(x∣θ)∗p(θ)p(x)p(\theta|x) = \frac{p(x|\theta)*p(\theta)}{p(x)}p(θ∣x)=p(x)p(x∣θ)∗p(θ)
p(x)p(x)p(x)与数据的分布有关,当数据确定时,p(x)p(x)p(x)是确定的。
如果p(θ∣x)p(\theta|x)p(θ∣x)与p(θ)p(\theta)p(θ)有相同的分布律。则说先验分布p(θ)p(\theta)p(θ)与后验分布p(θ∣x)p(\theta|x)p(θ∣x)属于似然概率p(x∣θ)p(x|\theta)p(x∣θ)的共轭分布
3. 狄利克雷分布
3.1 多项式分布
随机变量X∈[x1,x2,x3]X\in[x_{1},x_{2},x_{3}]X∈[x1,x2,x3],XXX取每个值时的概率如下表所示。
X | x1x_{1}x1 | x2x_{2}x2 | x3x_{3}x3 |
---|---|---|---|
P | p1p_{1}p1 | p2p_{2}p2 | p3p_{3}p3 |
在n次实验中,XXX取[x1,x2,x3][x_{1},x_{2},x_{3}][x1,x2,x3]的次数分别为[m1,m2,m3](m1+m2+m3=n)[m_{1},m_{2},m_{3}](m_{1}+m_{2}+m_{3}=n)[m1,m2,m3](m1+m2+m3=n),X的分布律为:
P(X)=Cnm1Cn−m1m2Cn−m1−m2m3p1m1p2m2p3m3P(X)=C_{n}^{m_{1}}C_{n-m_{1}}^{m_{2}}C_{n-m_{1}-m_{2}}^{m_{3}}p_{1}^{m_{1}}p_{2}^{m_{2}}p_{3}^{m_{3}}P(X)=Cnm1Cn−m1m2Cn−m1−m2m3p1m1p2m2p3m3
P(X)=n!m1!m2!m3!p1m1p2m2p3m3P(X)=\frac{n!}{m1!m_{2}!m_{3}!}p1^{m1}p_{2}^{m_{2}}p_{3}^{m_{3}}P(X)=m1!m2!m3!n!p1m1p2m2p3m3
由此推广到k维:
P(X)=n!Πi=1Kmi!Πi=1KpimiP(X)=\frac{n!}{\Pi_{i=1}^{K}m_{i}!}\Pi_{i=1}^{K} p_{i}^{mi}P(X)=Πi=1Kmi!n!Πi=1Kpimi
其中nnn是实验的次数,KKK是XXX可以取的类别数。Σi=1Kpi=1\Sigma_{i=1}^{K} p_{i}=1Σi=1Kpi=1
3.2 β\betaβ分布推广到狄利克雷分布
三维β\betaβ分布就是狄利克雷分布
f(x)=1B(α,β,γ)p1α−1p2β−1p3γ−1,p1+p2+p3=1f(x) = \frac{1}{B(\alpha,\beta,\gamma)}p_{1}^{\alpha-1}p_{2}^{\beta-1}p_{3}^{\gamma-1},p_{1}+p_{2}+p_{3}=1f(x)=B(α,β,γ)1p1α−1p2β−1p3γ−1,p1+p2+p3=1
其中,B(α,β,γ)=Γ(α)Γ(β)Γ(γ)Γ(α+β+γ)B(\alpha,\beta,\gamma)=\frac{\Gamma(\alpha)\Gamma(\beta)\Gamma(\gamma)}{\Gamma(\alpha+\beta+\gamma)}B(α,β,γ)=Γ(α+β+γ)Γ(α)Γ(β)Γ(γ)
推广到一般形式
f(x)=1B(α→)Πk=1Kpkαk,Σk=1Kpk=1f(x) = \frac{1}{B(\overrightarrow{\alpha})}\Pi_{k=1}^{K}p_{k}^{\alpha_{k}},\Sigma_{k=1}^{K}p_{k}=1f(x)=B(α)1Πk=1Kpkαk,Σk=1Kpk=1
其中,B(α→)=Πk=1KΓ(αk)Γ(Σk=1Kαk)B(\overrightarrow{\alpha})=\frac{\Pi_{k=1}^{K}\Gamma(\alpha_{k})}{\Gamma(\Sigma_{k=1}^{K}\alpha_{k})}B(α)=Γ(Σk=1Kαk)Πk=1KΓ(αk),α→=(α1,α2,...,αk)\overrightarrow{\alpha}=(\alpha_{1},\alpha_{2},...,\alpha_{k})α=(α1,α2,...,αk)
对比多项式的分布形式P(X)=n!Πi=1Kmi!Πi=1KpimiP(X)=\frac{n!}{\Pi_{i=1}^{K}m_{i}!}\Pi_{i=1}^{K} p_{i}^{mi}P(X)=Πi=1Kmi!n!Πi=1Kpimi与狄利克雷分布有相同的表达书形式,所以二者互为共轭分布。