统计中parameter estimation 的方法总结。Topic Model需要注意的

这篇博客总结了统计学中四种参数估计方法:点估计、最大似然估计(MLE)、最大后验估计(MAP)以及贝叶斯推断。在参数估计过程中,加入先验信息可以防止过拟合并引入额外知识。在Topic Model中,Gibbs Sampling用于处理因分母复杂性导致的困难,而Variational Inference则在未折叠的LDA中处理后验概率问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

个人总结:统计中参数估计有四种方法

点估计

MLE

MAP

  • 加入参数的prior 信息,可以避免overfitting,还可以加入extra knowledge。称为Occam’razor

Bayesian Inference

这种方法不像MLE,MAP将参数看成未知的常量,而是看成随机变量,求出其后验分布的具体形式 p(θ|X) ,然后用 E(θ|X) 作为估计值。

Topic Model 中的Gibbs Sampling

通常我们在topic model中的inference,全是这种思路。比方说 gibbs sampling, 如果是collapsed的话,不考虑 ϕ θ , 那么就是估计 z 了,(这里的z可以看成上面一段的 θ ).

所以可以用MLE, MAP和bayesian inference 来估计 z , 由于MLE和MAP不能计算出一个只包括z的式子,所以我们要用 bayesian inference, 求 p(z|w) , 但问题由来了,具体式子很难求,主要是因为分母,所以用gibbs sampling 来sample p(z|w) , 得到z的期望值。

总之 由于是collpased, 这里的objective 其实是 后验概率 p(z|w)

Topic Model中的Variational Inference

对于原始的LDA paper,即没有 β
这里的目标也是后验概率,只是没有collapsed掉, p(θ,z|w)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值