EM算法的推广
一、F函数的极大极大算法
F函数:假设隐变量Z的概率分布为P˜(Z)P~(Z) ,定义分布P˜P~ 与参数θθ 的函数如下:
F(P˜,θ)=EP˜[logP(Y,Z|θ)]+H(P˜)F(P~,θ)=EP~[logP(Y,Z|θ)]+H(P~)
式中H(P˜)=−EP˜logP˜(Z)H(P~)=−EP~logP~(Z) 是Z的概率分布的熵。
关于F函数的性质:
引理9.1:对于固定的θθ ,存在唯一的分布P˜θP~θ 极大化F(P˜,θ)F(P~,θ) ,其定义如下:
P˜θ(Z)=P(Z|Y,θ)P~θ(Z)=P(Z|Y,θ)
其值随参数变化而变化。
引理9.2:若P˜θ(Z)=P(Z|Y,θ)P~θ(Z)=P(Z|Y,θ) ,则有:
F(P˜,θ)=logP(Y|θ)F(P~,θ)=logP(Y|θ)
二、GEM算法
关于GEM算法,因书本中只是列出了算法,所以可以看《统计学习方法》第168页,这里不进行叙述