机器学习:LDA_数学基础_6:MCMC:Dirichlet分布

本文介绍了二元分布、多项分布及其对应的共轭先验Beta分布和Dirichlet分布。详细探讨了这些分布的参数估计方法,并通过最大化对数似然函数来求解最大似然估计。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1. 二元分布

  • x{0,1} ; 0<=μ<=1

Bern(x|μ)=μx(1μ)1x

  • 设数据集合是 D={x1,...,xN} ,且每次观测都是从 p(x|μ) 中得到;则似然函数是

p(D|μ)=Nn=1p(xn|μ)=Nn=1μxn(1μ)1xn

=> 最大化对数似然函数,可得

  • μML=1NNn=1xn=mN

其中:m是正面朝上的次数


2. Beta分布

  • 二项分布中正面向上的比例就是均值
  • 所以小规模数据会产生过拟合现象

共轭性

  • 设先验概率是:p(μ)
  • 似然函数是:μx(1μ)1x
  • 选择似然函数的共轭先验作为P(θ)的分布

Beta分布

  • 选择先验分布是Beta分布
  • beta分布和二项分布是共轭分布
  • beta分布和似然函数是共轭先验
先验似然
高斯高斯
Beta二项
Gamma高斯
Dirichlet多维正态

Beta(μ|a,b)=Γ(a+b)Γ(a)Γ(b)μ(a1)(1μ)(b1)

Γ(x)=0ux1eudu

E[μ]=aa+b
var[μ]=ab(a+b)2(a+b+1)
其中:a,b


Beta后验

p(μ|m,l,a,b)μm+a1(1μ)l+b+1 ………其中:l=Nm:


3. 多项分布

Kk=1xk=1; 如果 μxk 表示 xk=1的概率, 则 x 的分布

p(x|μ)=k=1Kμxkk

E[x|μ]=xp(x|μ)x=(μ1,μ2,...,μK)T=μ

数据集分布

  • N个独立观测值:x1,......,xN的数据集 D, 似然函数是:

p(D|μ)=Nm=1Kk=1μxnkk=Kk=1μmkk
其中:mk=nxnk

  • 最大似然解

μMLk=mkN

多项式分布

Mult(m1,.....,mK|μ,N)=(Nm1m2...mK)Kk=1μmkk


4. Dirichlet分布

Dir(μ|α)=Γ(α0)Γ(α1)..Γ(αK)k=1Kμαk1k


5. 结论

  • Beta分布,E[μ]=aa+b 超参数,可以控制 μ ;
  • Dirichlet 分布
    E(p)=(α1Ki=1αi,α2Ki=1αi,...,αKKi=1αi)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值