GMM

最新推荐文章于 2024-12-01 16:09:45 发布

原创最新推荐文章于 2024-12-01 16:09:45 发布 · 459 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#GMM #Clustering #高斯混合模型

机器学习专栏收录该内容

1 篇文章

订阅专栏

GMM

0x00. 简介

高斯混合模型是具有如下形式的概率分布模型：

P (y | θ) = \sum k = 1 K α k ϕ (y | θ k)

$P(y|\theta) = \sum^K_{k=1} \alpha_k\phi(y|\theta_k)$
其中

αk $\alpha_k$ 是系数，

αk≥0 $\alpha_k\geq0$ 并且

∑k=1Kαk=1 $\sum\limits^K_{k=1}\alpha_k=1$ ，

ϕ(y|θk) $\phi(y|\theta_k)$ 是高斯分布密度，

θk=(μk,σ2k) $\theta_k=(\mu_k, \sigma^2_k)$ ，由K个分模型构成

0x01. 高斯混合模型参数估计的EM算法

我们的目的是用EM算法估计高斯混合模型的参数 $\theta$ , 其中 $\theta=(\alpha_1, \alpha_2,...,\alpha_k; \theta_1, \theta_2,...,\theta_k)$

a). 明确隐变量，写出complete data的对数似然函数

设想观测数据是这样产生的：首先依据概率选择高斯分布分模型，然后依据该分模型的参数生成观测数据。其中生成的数据是可以被观测到的，但是该数据来自哪一个分模型的信息是未知的。

我们定义隐变量：

γ j k = {1, 0, 第 j 个 观 测 数 据 来 自 第 k 个 分 模 型 o t h e r w i s e j = 1, 2, . . ., N; k = 1, 2, . ., K

$\gamma_{jk}=\begin{cases}1, &第j个观测数据来自第k个分模型\\0, &otherwise\end{cases}\\ j=1,2,...,N;\ k=1,2,..,K$

对于一个观测数据 $y_i$ ，我们的完全数据是

(y j, γ j 1, γ j 2, . . ., γ j K), j = 1, 2, . . ., N

$(y_j,\gamma_j1,\gamma_j2,...,\gamma_jK), j=1,2,...,N$ 我们便可以得到完全数据的似然函数

b). E步：确定Q函数

Q函数的含义：完全数据的对数似然函数的期望。关于未观测数据Z的条件概率分布的期望。也就是说，Z的取值有很多种，我们先确定下来Z，然后再根据Z和当次迭代的 $\theta$ 的值算出来Z和Y（观测数据）的期望，目的是在下一步最大化这个期望。

c). M步：最大化Q
对于得到的Q函数，我们求其对于 $\theta$ 的最大值，即求新一轮迭代的模型参数：

θ (i + 1) = arg max θ Q (θ, θ (i))

$\theta^{(i+1)}=\arg \max \limits_{\theta}Q(\theta, \theta^{(i)})$
对于我们要求的三组参数，我们直接对其求偏导或者求其在约束条件下的偏导即可。在这个过程中，Q函数的表达式可能不会被显式计算。

0x02. 总结

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。