1.EM算法的简介
引出EM算法:
一般的极大似然估计可以解决没有“隐变量”数据样本的问题,但是实际中往往数据是含有“隐变量”的EM算法就是专门解决这种问题而引出的,它也是通过近似的极大似然估计求解含有隐变量的概率模型的参数。
ps:专门求解含有隐变量的问题。
算法的过程:
第一步(E),求期望,第二步(M):求极大。
ps:先初始化参数,然后对样本进行求隐变量的值,在对模型求期望,最后求极大更新参数变量,反复迭代直到收敛。
ps:求期望的过程就是取下界的过程,求隐变量的过程就是我们需要的那个值(服从条件分布)。
ps:例如K-Means算法可以用此算法来解释。
2.EM算法的推导
对数似然函数:
ps:通过极大似然估