EM 算法

EM算法详解

最新推荐文章于 2021-02-02 00:26:22 发布

原创最新推荐文章于 2021-02-02 00:26:22 发布 · 286 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

机器学习专栏收录该内容

4 篇文章

订阅专栏

EM 算法

如果概率模型的变量都是观测变量，那么给定数据，可以直接使用极大似然估计法。但当模型含有隐含变量时，不能简单的进行极大似然估计，需要EM算法。因此EM算法是对含有隐含变量的概率模型参数进行极大似然估计。

为了说明EM算法，首先介绍Jession不等式。

Jession inequality

如果 f 为凸函数 $f''(x)\geq 0$ ,那么 $f(E(x)) \leq E(f(x))$

如果 f 为凹函数 $f''(x)\leq 0$ ,那么 $f(E(x)) \geq E(f(x))$

$f(E(x)) = E(f(x))$ 的充要条件是随机变量x在概率1下取相同值。

下面来推导EM算法：

模型： $P(x,z,\theta)$

仅观测到 x

目标：最大化极大似然函数 $l(\theta) =\sum_{i=1}^mlog(P(x^i,\theta)) =\sum_{i=1}^mlog(\sum_{z^i}P(x^i,z^i\theta))$

上述问题的难点是log中含有加法。

基本精神 ：初始化参数 $\theta$ ，建立一个对数似然函数的比较紧密的下界，猜测参数之后，找到这个函数取最大值的 $\theta$ ，并重复上述过程，直到收敛到函数的一个局部最优值（不保证达到全局最优解）。

$l(\theta) = \sum_ilog(P(x^i,\theta)) =\sum_{i=1}log(\sum_{z^i}P(x^i,z^i,\theta))$

$=\sum_{i=1}log(\sum_{z^i}Q(z^i)\frac{P(x^i,z^i,\theta))}{Q(z^i)}$

其中 $Q_i(z^i)$ 为 $z^i$ 的一个概率分布

$=\sum_ilog E_{z^i \in Q}[\frac{P(x^i,z^i,\theta))}{Q(z^i)}]$

根据Jession不等式，有

$\geq \sum_iE_{z^i \in Q}[log(\frac{P(x^i,z^i,\theta))}{Q(z^i)})]$

$=\sum_i\sum_{z^i}Q(z^i)log(\frac{P(x^i,z^i,\theta))}{Q(z^i)})$

当 $\frac{P(x^i,z^i,\theta))}{Q(z^i)}$ 以概率1取恒定值时，等号成立，因此，获得原始函数的一个紧密的下界。选取合适的 $Q(z^i)$ 使得等式成立。

根据 $\frac{P(x^i,z^i,\theta))}{Q_i(z^i)} =constant$ ,可以得到： $Q(z^i)$ 正比于 $P(x^i,z^i,\theta)$

$\sum_{z^i}Q(z^i) = 1$

根据上边两式可以得到： $Q(z^i) = \frac{P(x^i,z^i,\theta)}{\sum_{z^i}P(x^i,z^i,\theta)} = \frac{P(x^i,z^i,\theta)}{P(x^i,\theta)} =P(z^i|x^i,\theta)$

因此EM算法总结如下：

E-step：

计算 $Q_i(z^i) = P(z^i|x^i,\theta)$

M-step:

最大化紧却下界函数：

$\theta = argmax_{\theta}\sum_i\sum_{z^i}Q(z^i)log(\frac{P(x^i,z^i,\theta))}{Q(z^i)})$

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。