来个例子，再解释一次 EM 算法

EM算法解析

最新推荐文章于 2022-09-09 19:42:46 发布

转载最新推荐文章于 2022-09-09 19:42:46 发布 · 287 阅读

·

0

·

本文通过一个抛硬币实验的实例，详细解析了EM算法的工作原理，包括E步和M步的具体计算过程，以及如何通过迭代逐步优化硬币正反面出现的概率估计。

前天推了一篇关于EM算法的文章，后台有留言反映不太明白，包括解释EM使用的抛硬币的例子。

今天，借助 2008 年论文中给出的解释EM算法的例子，最后解释EM算法：E步和M步

论文题目：
What is the expectation maximizationalgorithm?

这是论文中的那幅图：

下面解释这些数字是如何得来的。

Step1 纯碎靠猜

假定硬币A正面朝上的概率为 0.6, 硬币B正面朝上的概率为 0.5

Step2 做实验

开展 5 轮实验，每轮抛掷 10 次，全部实验结果如下所示：

下面依次分析每轮实验结果。

第一轮结果：5次朝上，5次朝下。如果选择硬币A，则发生此结果的概率为：Pa = 0.6^5*0.4^5; 如果选择硬币B，概率为：Pb = 0.5^5*0.5^5; 则选择硬币A的概率为：Za = Pa/(Pa+Pb) ，选择硬币B的概率为：Zb = 1- Za.

计算一下：

Pa = 0.6**5*0.4**5
Pb = 0.5**5*0.5**5
Za = Pa/(Pa+Pb)
Zb = 1- Za

结果：

In [11]: Za
Out[11]: 0.44914892610093643

In [12]: Zb
Out[12]: 0.5508510738990635

四舍五入，即 0.45, 0.55。分别就是选择硬币 A 和硬币 B 的概率。

选择硬币 A 的概率为 0.45，抛掷硬币 10 次，正反出现的总次数期望值为：0.45 * 10，即 4.5 次。第一轮实验结果：5正5反，所以正面出现次数的期望值为：4.5 * (5/10)，即为 2.25 次，反面出现 2.25 次；

同理分析硬币B。选择硬币 B 的概率为 0.55，抛掷硬币 10 次，正反出现的总次数期望值为：0.55 * 10，即 5.5 次。第一轮实验结果：5正5反，所以正面出现次数的期望值为：5.5 * (5/10)，即为 2.75 次，反面出现 2.75 次；

同理分别求出第二轮到第五轮实验，选择硬币 A 的概率及对应的正反面出现次数的期望值，选择硬币 B 的概率及对应的正反面出现次数的期望值。

第一轮到第五轮实验全部分析完成后，得到如下结果，左侧表格为选择硬币A和B的概率分布（也就是隐变量的概率分布）；右侧表格为硬币A和B在10次抛掷实验中正、反出现次数的期望分布（也就是可观察变量的概率分布）。

Step3 似然估计

纵观 5 轮总结 50 次抛掷硬币，可以计算出硬币 A 、B 正面出现的概率。

硬币 A 正面出现次数：

2.2 + 7.2 + 5.9 + 1.4 + 4.5 = 21.2

硬币 A 反面出现次数：

2.2 + 0.8 + 1.5 + 2.1 + 1.9 = 8.5

同理求得硬币 B

得到论文图中的结果(小数点位数精度，稍有偏差，不碍事，理解就行)

至此又得到一个硬币A、B 正面出现概率的估计值，这次是基于实验得到，而不是像刚开始那样纯碎靠蒙（纯碎靠蒙时为 0.6, 0.5）。

完成一次分布参数的迭代。

Step4 迭代10次

10 轮迭代后，参数更新为如下，对应论文中的 Step4

Done~

欢迎扫码关注：

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。