EM算法:由浅入深

1.1 简介

期望最大化(ExpectationMaximization)算法最初是由Ceppellini[2]等人1950年在讨论基因频率的估计的时候提出的。后来又被Hartley[3]和Baum[4]等人发展的更加广泛。目前引用的较多的是1977年Dempster[5]等人的工作。它主要用于从不完整的数据中计算最大似然估计。后来经过其他学者的发展,这个算法也被用于聚类等应用。

1.2 最大似然估计


重复强调下,EM算法主要用于从 不完整 的数据中计算最大似然估计,本身可以看成是特殊情况下计算极大似然的一种方法。

极大似然估计是要解决这样一个问题:给定一组数据和一个参数待定的模型,如何确定模型的参数,使得这个确定参数后的模型在所有模型中产生已知数据的概率最大。(模型已定,参数未知)

我们通过一个抛硬币的实验和体会下算法的思想。

考虑一个投掷硬币的实验:现在我们有两枚硬币AB,这两枚硬币和普通的硬币不一样,他们投掷出正面的概率和投掷出反面的概率不一定相同。我们将AB 投掷出正面的概率分别记为θAθB。我们现在独立地做5 次试验:随机的从这两枚硬币中抽取1 枚,投掷10 次,统计出现正面的次数。将结果整理为如下的表格:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值