高斯混合模型是由多个高斯子模型线性组合而成的模型,当数据的分布比较复杂时,用单一的高斯模型来表示数据的分布不能很好地反映数据分布的特点,如果用多个高斯子模型的线性组合显然更能准确的反映数据的分布。
P(y|θ)=∑k=1Kαϕ(y|θk)P(y|θ)=∑k=1Kαϕ(y|θk)
其中,αk≥0αk≥0是系数,∑k=1Kαk=1∑k=1Kαk=1,ϕ(y|θk)ϕ(y|θk)是高斯分布密度,θk=(μk,σ2k)θk=(μk,σk2)是高斯模型的参数,
ϕ(y|θk)=12π−−√σkexp(−(y−μk)22σ2k)ϕ(y|θk)=12πσkexp(−(y−μk)22σk2)
称为一个高斯子模型。