【Estimation of the Number of Clusters】X-means in ICML 2000 个人理解

X-means算法是K-means的一种扩展,主要用于自动估计无标签数据的类别数量。它通过在现有簇上应用K-means并比较分割前后的BIC(贝叶斯信息准则)分数来决定是否继续分割。算法从预设的最小类别数开始,不断尝试分割簇,直到BIC分数不再增加或达到预设的最大类别数。BIC用于平衡模型复杂度和拟合优度,帮助确定最佳的簇数量。

一、简介

题目: X-means: Extending K-means with Efficient Estimation of the Number of Clusters
会议: ICML 2000
任务: 估计无标签数据的类别数量并聚类。
Idea: 给定预估的类别数上下界,从下界开始做一次 k k k-means,再对每个簇进行 k k k-means( k = 2 k=2 k=2),之后通过贝叶斯信息准则(Bayesian Information Criterion, BIC)判断 k k k应该等于2还是1,如此往复直至 k k k不再增加或到达上界。

二、详情

x-means
如图,X-means通过将现有簇一分为二并对比前后BIC分数来确定当前簇是否应该被分割。

1. 算法步骤

输入:无标签数据 D D D,预估类别数上下界限 K max ⁡ K_{\max} Kmax K min ⁡ K_{\min} Kmin
输出:预测的类别数量和聚类结果。
(1)初始化 k n e w = K min ⁡ k_{new}=K_{\min} k

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Fulin_Gao

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值