【Estimation of the Number of Clusters】PG-means: learning the number of clusters in data in NIPS 个人理解

一、简介

题目: PG-means: learning the number of clusters in data
会议: NIPS 2006
任务: 估计无标签数据的类别数量 k k k并聚类。
Idea: 最初给定一个较小的 k k k(最小为1)在原始无标签数据上拟合高斯混合模型(gaussian mixture model, GMM);将无标签数据和GMM的参数(均值、斜方差)映射为一维,然后基于映射后的GMM参数进行采样;之后使用Kolmogorov-Smirnov (KS) test检验映射后的数据和采样是否匹配,若匹配,则迭代终止,否则,令 k  ⁣ =  ⁣ k  ⁣ +  ⁣ 1 k\!=\!k\!+\!1 k=k+1更新GMM并陆续进行映射、采样、检验。
Code: GitHub
Note: 虽然该方法叫PG-means,但与X-meansG-means基于 k k k-means不同,它是基于GMM的。

PG-means
如图,为PG-means的算法流程,下节做详细介绍。

二、详情

1. 算法步骤

输入:无标签数据 { X } d × n \{\pmb X\}_{d\times n} { X}d×n n n n是样本数, d d d是样本维度),置信阈值 α \alpha α,映射次数 p p p
输出:预测的类别数量和聚类结果。
(1)初始化 k = 1 k=1 k=1
(2)在 X \pmb X X上根据 k k k拟合GMM,GMM中有 k k k个均值 { μ } d × 1 \{\pmb\mu\}_{d\times 1}

评论 1
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Fulin_Gao

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值