【ML小结9】聚类分析--k均值聚类

本文详细介绍了K均值聚类算法,包括其与高斯混合模型的关系、步骤、数据预处理、模型表示、k值确定方法(如手肘法和轮廓系数法)以及初始点选择策略,特别提到了使用层次聚类算法来帮助选择初始聚类中心。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

无监督聚类
K-means算法可以被视为高斯混合模型(GMM)的一种特殊形式

K均值聚类算法是先随机选取K个对象作为初始的聚类中心。然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。一旦全部对象都被分配了,每个聚类的聚类中心会根据聚类中现有的对象被重新计算。这个过程将不断重复直到满足某个终止条件。终止条件可以是没有(或最小数目)对象被重新分配给不同的聚类,没有(或最小数目)聚类中心再发生变化,误差平方和局部最小。

数据预处理

对数据进行归一化

模型表示

给定样本集D={ x1,...,xm}D=\{x_1,...,x_m\}D={ x1,...,xm},针对聚类所得簇划分C={ C1,...,Ck}C=\{C_1,...,C_k\}C={ C1,...,

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值