高斯混合模型(Gaussian Mixture Model, GMM)

一、GMM 是什么?

高斯混合模型(Gaussian Mixture Model, GMM)是一种概率模型,用于表示数据分布是由多个高斯分布(正态分布)的加权组合构成的。它假设数据点是从若干个高斯分布中生成的,每个高斯分布代表一个“簇”或“子群体”。GMM 是一种软聚类方法,与 K-Means 不同,它不仅能将数据点分配到某个簇,还能给出数据点属于每个簇的概率。

1.1 核心思想

  • 混合模型:GMM 认为数据集中的每个数据点都由多个高斯分布共同生成,每个高斯分布有自己的均值、协方差矩阵和权重。
  • 概率分布:每个数据点的概率密度是所有高斯分布的加权和。
  • 软分配:不像 K-Means 那样将每个数据点硬性分配到一个簇,GMM 为每个数据点计算属于各个簇的概率(即“责任”)。

1.2 数学表达

假设我们有 KKK 个高斯分布,数据集为 X={ x1,x2,…,xN}X = \{x_1, x_2, \dots, x_N\}X={ x1,x2,,xN},其中 xi∈Rdx_i \in \mathbb{R}^dxiRdddd 维向量。GMM 的概率密度函数为:

p(x)=∑k=1KπkN(x∣μk,Σk)p(x) = \sum_{k=1}^K \pi_k \mathcal{N}(x | \mu_k, \Sigma_k)p(x)=k=1KπkN(xμk,Σk)

其中:

  • πk\pi_kπk:第 kkk 个高斯分量的混合系数(权重),满足 ∑k=1Kπk=1\sum_{k=1}^K \pi_k = 1k=1Kπk=1πk≥0\pi_k \geq 0πk0
  • N(x∣μk,Σk)\mathcal{N}(x | \mu_k, \Sigma_k)N(xμk,Σk):第 kkk 个高斯分布的概率密度函数,均值为 μk\mu_kμk,协方差矩阵为 Σk\Sigma_kΣk,其表达式为:
    N(x∣μk,Σk)=1(2π)d/2∣Σk∣1/2exp⁡(−12(x−μk)TΣk−1(x−μk))\mathcal{N}(x | \mu_k, \Sigma_k) = \frac{1}{(2\pi)^{d/2} |\Sigma_k|^{1/2}} \exp\left(-\frac{1}{2}(x - \mu_k)^T \Sigma_k^{-1} (x - \mu_k)\right)N(xμk,Σk)=(2π)d/2Σk1/21exp(21(xμk)TΣk1(xμk))
  • 参数集合:GMM 的参数包括 { πk,μk,Σk}k=1K\{ \pi_k, \mu_k, \Sigma_k \}_{k=1}^K{ πk,μk,Σk}
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

爱看烟花的码农

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值