EM算法是本人专栏-数据挖掘十大算法倒数第二篇
因为EM算法推导过程比较复杂,所以我们把推导过程中相关的知识点都会做一个介绍,所以篇幅会比较长,具体的步骤如下:
1、熵的相关知识
2、从概率论到似然
3、EM的引入及推导
一、熵的相关知识
1> 熵
在我之前的文章溯源探幽--熵的世界里具体说过熵的由来,这里只做简单的引入
熵的量化
接下来从数据角度量化一下:
熵:是表示随机变量不确定性的度量,熵的取值越大,随机变量的不确定性也越大。
设X是一个取有限个值的离散随机变量,其概率分布为
P(X=xi)=pi, i=1,2,⋯,n
熵计算公式:H(X)=- ∑ pi * logpi,i=1,2, ... , n
一个栗子: A集合[1,1,2,2,2,2,2,2,2,2]