极大似然估计和EM算法学习笔记

最新推荐文章于 2023-12-01 22:56:31 发布

原创

最新推荐文章于 2023-12-01 22:56:31 发布 · 741 阅读

5 ·

CC 4.0 BY-SA版权

本文探讨了极大似然估计和EM算法在参数估计中的应用，通过掷硬币游戏的例子详细解析了两种方法的计算过程，展示了如何在数据不完全的情况下进行有效的模型参数估计。

极大似然估计和EM算法

极大似然估计
- 例子
EM算法
- 例子

极大似然估计

估计类条件概率的一种常用策略是先假定其具有某种确定的概率分布形式，再基于训练样本对概率分布的参数进行估计。具体地，记关于类别 $c$ 的类条件概率为 $P (x ∣ c)$ ，假设 $P (x ∣ c)$ 具有确定的形式并且被参数向量 $\theta_c$ 唯一确定，则我们的任务就是利用训练集 $D$ 估计参数 $\theta_c$ 。为明确起见，我们将 $P (x ∣ c)$ 记为 $P(x|\theta_c)$ 。

令 $D_c$ 表示训练集 $D$ 中第 $c$ 类样本组成的集合，假设这些样本是独立同分布的，则参数 $\theta_c$ 对于数据集 $D_c$ 的似然是

$P(D_c|\theta_c)=\prod_{x\in D_c}P(x|\theta_c).\tag{1}$

对 $\theta_c$ 进行极大似然估计，就是去寻找能最大化似然 $P(D_c|\theta_c)$ 的参数值 $\hat{\theta}_c$ 。直观上看，极大似然估计是试图在 $\theta_c$ 所有可能的取值中，找到一个能使数据出现的“可能性”最大的值。

式(1)中的连乘操作易造成下溢，通常使用对数似然(log-likelihood)

$\begin{aligned} LL(\theta_c)&=\log P(D_c|\theta_c)\\ &=\log \prod_{x\in D_c}P(x|\theta_c)\\ &=\sum_{x\in D_c}\log P(x|\theta_c),\tag{2} \end{aligned}$