EM(Expectation Maximization) 算法推导（一）

最新推荐文章于 2025-11-30 15:25:22 发布

原创

最新推荐文章于 2025-11-30 15:25:22 发布 · 360 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#机器学习 #算法 #人工智能 #最大期望算法

本文深入探讨了EM算法在参数估计中的应用，详细解析了其背后的数学原理，包括极大似然估计、对数似然函数以及算法的迭代过程。并通过高斯混合模型的实例，阐述了EM算法如何处理观测变量与隐变量的问题。

EM算法公式推导

最近一直在B站上看一个UP主的机器学习白板推导，感觉很有益处，因为之前看过的各种博客似乎都一直强调对EM算法的感性认识，缺少了很多的推导过程。我想，要完全理性地了解这个算法，还是要一步一步地通过推导。

主要参考资料：白板推导视频

以下所有推导公式都是latex手打。

参数估计与EM算法

EM算法解决的其实是一个参数估计的问题。在普通的参数估计中
我们要做的其实是
$\theta=\argmax P(X| \theta)$
其中X是现有的已知数据（观测变量），而 $\theta$ 则是参数，这个参数代表的可以只有一个参数，也可以是很多参数。

在概率统计中其实我们学过参数估计的方法，也就是矩估计法估计和极大似然估计。我们在实际中用的更多的是极大似然估计，在及算法的过程中常常有一个技巧，将连乘后的结果取log为底，这也就有了对数似然的这个概念。如下图所示：
$L(X;\theta)=P(x_1|\theta)\cdot P(x_2|\theta) \cdots P(x_n|\theta)$
$\log L(X;\theta) =\sum_{i=i}^n \log (x_i|\theta)$
最后对 $\theta$ 进行求导并为0，可以得到 $\hat{\theta}$ 关于 $X$ 的表达式。