高斯混合模型GMM与EM算法的Python实现

最新推荐文章于 2023-07-19 21:01:32 发布

aizhao3648

最新推荐文章于 2023-07-19 21:01:32 发布

阅读量2.6k

点赞数

CC 4.0 BY-SA版权

文章标签： python 人工智能

原文链接：http://www.cnblogs.com/wt869054461/p/10988475.html

本文介绍了高斯混合模型（GMM）及其使用最大期望算法（EM）的Python实现。GMM是一种软聚类模型，扩展了K-means，考虑了数据的均值和方差。EM算法包括E步骤（更新隐变量）和M步骤（更新模型参数）。通过实例展示了如何初始化、迭代求解并最终得到GMM模型。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

GMM与EM算法的Python实现

高斯混合模型(GMM)是一种常用的聚类模型，通常我们利用最大期望算法(EM)对高斯混合模型中的参数进行估计。

1. 高斯混合模型(Gaussian Mixture models, GMM)

高斯混合模型（Gaussian Mixture Model，GMM）是一种软聚类模型。 GMM也可以看作是K-means的推广，因为GMM不仅是考虑到了数据分布的均值，也考虑到了协方差。和K-means一样，我们需要提前确定簇的个数。

GMM的基本假设为数据是由几个不同的高斯分布的随机变量组合而成。如下图，我们就是用三个二维高斯分布生成的数据集。

png

在高斯混合模型中，我们需要估计每一个高斯分布的均值与方差。从最大似然估计的角度来说，给定某个有n

这里直接计算似然函数比较困难，于是我们引入隐变量(latent variable)，这里的隐变量就是每个样本属于每一簇的概率。假设

在已知W

将其写成

其中P(X_i | μ_j, σ_j)

以一维高斯分布为例，

2. 最大期望算法(Expectation–Maximization, EM)

有了隐变量还不够，我们还需要一个算法来找到最佳的

简单说来，EM算法分两个步骤。

第一个步骤是E（期望），用来更新隐变量W
第二个步骤是M（最大化），用来更新GMM中各高斯分布的参量

然后重复进行以上两个步骤，直到达到迭代终止条件。

3. 具体步骤以及Python实现

完整代码在第4节。

首先，我们先引用一些我们需要用到的库和函数。

1 import numpy as np
2 import matplotlib

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。