机器学习笔记——11 混合高斯模型(Mixtures of Gaussian):利用EM算法估计参数
本文主要介绍混合高斯模型,它涉及到对个分布来源,因此参数的估计将是一个难题。本文着重介绍如何利用EM算法对参数进行估计。
混合高斯模型(Mixtures of Gaussian)
在我们之前接触的大部分分布中,样本数据大部分独立同分布与某个分布。但是混合高斯模型中,样本数据并不是来自一个单一的高斯分布,而是来自多个高斯分布。我们假设共有kkk个高斯分布,如果第i个样本x(i)x^{(i)}x(i)来自第j个高斯分布,记z(i)=jz^{(i)} = jz(i)=j。在高斯混合模型中,p(x∣z=j)=N(uj,Σj)p(x|z = j) = N(u_j,\Sigma_j)p(x∣z=j)=N(uj,Σj)。而参数zzz服从多项分布Multinomial(ϕ)Multinomial(\phi)Multinomial(ϕ)。即zzz取jjj的概率为ϕj\phi_jϕj。由此我们可以导出混合高斯的边缘分布为:m(x)=∑j=1kp(z=j)p(x∣z=j)=∑j=1kϕjp(x∣uj,Σj)m(x) = \sum_{j = 1}^{k}p(z = j)p(x|z = j) = \sum_{j = 1}^{k}\phi_jp(x|u_j,\Sigma_j)m(x)=j=1∑kp(z=j)p(x∣z=j)=j=1∑kϕjp(x∣uj,Σj)因此样本的对数似然函数为:ℓ(ϕ,u,Σ)=log∏i=1mm(x(i))=∑i=1mlogm(x(i))=∑i=1mlog∑j=1kϕjp(x∣uj,Σj)\begin{aligned} \ell(\phi,u,\Sigma) = & \log \prod_{i = 1}^{m}m(x^{(i)}) \\ =& \sum_{i = 1}^{m}\log m(x^{(i)}) \\ =& \sum_{i = 1}^{m}\log \sum_{j = 1}^{k}\phi_jp(x|u_j,\Sigma_j) \\ \end{aligned}ℓ(ϕ,u,Σ)===logi=1