机器学习笔记_$EM$算法

原创于 2018-03-27 10:14:35 发布 · 213 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

机器学习专栏收录该内容

46 篇文章

订阅专栏

本文详细介绍了EM算法的工作原理及其在处理含有隐变量的数据集时的应用。通过迭代的方式，EM算法能够逐步逼近参数的最大似然估计。

适用范围

假设训练样本的属性变量是不完整的

隐变量

令 $\mathbf{X}$ 表示已经观测的变量集合， $\mathbf{Z}$ 表示隐变量集， $\Theta$ 表示模型参数.如果对 $\Theta$ 做最大似然估计，则应当最大化对数似然

L L (Θ ∣ X, Z) = ln P (X, Z ∣ Θ)

$LL(\Theta\mid\mathbf{X},\mathbf{Z})=\ln{P}(\mathbf{X},\mathbf{Z}\mid\Theta)$
然而由于

ZZ $Z$ 是隐藏变量，上式无法直接求解。此时我们可以通过对

Z

$Z$ 计算期望，来最大化已观测数据的对数“边际似然”（marginal likelihood）

L L (Θ ∣ X) = ln P (X ∣ Θ) = ln \sum Z P (X, Z ∣ Θ) (A)

$LL(\Theta\mid\mathbf{X})=\ln{P}(\mathbf{X}\mid\Theta)=\ln\sum_{\mathbf{Z}}{P}(\mathbf{X},\mathbf{Z}\mid\Theta)\tag{A}$

EM（Expectation_Maximization）算法

EM是常用的估计参数隐藏变量的利器，它是一种迭代式方法，其基本思想是：若参数 $\Theta$ 已知，则可以对训练数据集推断出最优隐变量 $Z$ 的值（ $E$ 步）；反之，若 $Z$ 的值已知，则可以方便对参数 $\Theta$ 做极大似然估计（ $M$ 步）。
于是，以初始值 $\Theta^{0}$ 为起点，对( $A$ ),可以迭代执行以下步骤直至收敛：

基于推断隐变量Z的期望，记做Zt
- 基于已观测变量 $\mathbf{X}$ 和 $\mathbf{Z}^{t}$ 对参数 $\Theta$ 做极大似然估计，记做 $\Theta^{t+1}$
  
  EM算法的步骤
  
  E步
  
  以当前参数 $\Theta^{t}$ 推断隐变量分布 $P(\mathbf{Z}\mid\mathbf{X},\Theta^{t})$ ,并计算对数似然 $LL(\Theta\mid\mathbf{X},\mathbf{Z})$ 关于 $\mathbf{Z}$ 的期望
  
  $Q (Θ ∣ Θ t) = E Z ∣ X, Θ t L L (Θ ∣ X, Z)$ $Q(\Theta\mid\Theta^{t})=\mathbb{E}_{\mathbf{Z}\mid\mathbf{X},\Theta^{t}}LL(\Theta\mid\mathbf{X},\mathbf{Z})$
M步

寻找参数最大化的期望似然，即

Θt+1=argminΘQ(Θ∣Θt)

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。