em 流程示例解释

最新推荐文章于 2025-03-08 09:26:48 发布

原创最新推荐文章于 2025-03-08 09:26:48 发布 · 1.1k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

dm 专栏收录该内容

51 篇文章

订阅专栏

通过一个具体案例，介绍如何使用EM算法来估计未知参数的概率。在硬币抛掷实验中，即使缺少完整数据集，也能逐步逼近真实概率。

1 极大似然估计：

已知两枚硬币，每次等概率随机选择其中1枚掷10次，正面记为H，反面为T;

其中A被选中3次， B被选中2次；每次的正反次数见图上半部分。

则可以估计A掷出正面的概率就是 total(A.H)/total(A) = 24/30=0.8, 同理可得B正面的概率是 0.45

问题很简单，解答也很直观。

问题改变如下：

2 A，B总共掷了5次，但不知道A被选中几次、哪次是A掷出来的，更不知道A掷出正面的概率；也不知道B的这些信息。如何求出A、B掷出正面的概率？

解答过程：

A、B掷出正面是相互独立的

1）初始随机选择值： A.h=0.6, B.h=0.5

2）对每次掷硬币过程（每个观测样本），根据掷硬币结果计算此轮选中的硬币是A、B的概率。以第一轮5正5反为例：

Sa/Sb = C(10, 5) * 0.6^5 * 0.4^5 / [C(10, 5) * 0.5^5 * 0.5^5]; 且Sa + Sb = 1。

所以Sa = 0.45, Sb = 0.55; A掷出正面为5 * 0.45 = 2.2 次，反面为5 * 0.45 = 2.2次。

同理对另外4次掷硬币过程，也可得到选中A、B的概率以及A、B的正反面次数。

3）重新估计A.h, B.h。如何重新估计？根据步骤2的结果中， A.h = total(A.H)/total(A) = 21.3/29.9 = 0.71, B.h = 0.58;

使用该值，从步骤2重新循环计算，迭代。直到两次迭代得到的A.h之差在阀值限制之内，两次迭代得到的B.h之差在阀值之内

4）迭代结束时得到A.h=0.8, B.h=0.52；十分接近理想值【理想值无法得到】

over。

此示例中， 5次掷币过程称作Incomplete data(因为不知道每次掷币过程选择的到底是A还是B)，每次到底选择的是A还是B称作z,隐藏变量、潜在变量

杯具，业余选手，各EM论文中对这些的描述都不一致，让人头晕脑胀，迷糊好几天

但是，但是，从此过程中没有看出E、M过程啊

6 条评论

aalbertini 2010.08.23
第一步是计算期望（E），利用对隐藏变量的现有估计值，计算其最大似然估计值；第二步是最大化（M），最大化在 E 步上求得的最大似然值来计算参数的值。 M 步上找到的参数估计值被用于下一个 E 步计算中，这个过程不断交替进行。 ===================================== 应该是 E, 利用现有参数估计值，求隐藏变量的极大似然估计 M, 利用隐藏变量的极大似然估计值，来优化参数 =====================================

aalbertini 2010.08.16
M step: 求极大似然估计值。 The m step maximizes a likelihood funtion that is further refined in each iteration by the e step

aalbertini 2010.08.16
E step: 是指计算隐藏变量的期望

aalbertini 2010.08.16
E step: 计算当前theta, 样本数据下，隐藏变量的期望 M step: 在当前隐藏变量值、当前theta情况下计算理论下的样本分布，求使得该理论分布可能性最大的theta[极大似然估计]

aalbertini 2010.08.16
z隐藏变量，每次抛掷选中的是A还是B？ E step: 计算当前theta、抛掷结果下， z的期望？ M step: 根据z的期望最大化theta

aalbertini 2010.08.13
还需要结合理论进行理解、进一步的抽象成一个通用的；和论文描述的模型一致。

评论 6

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

查看更多评论

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。