经典聚类算法——K-means

本文详细介绍了K-means聚类算法的工作原理及其局限性,包括如何确定聚类数量K值、处理空聚类的方法及对数据的要求等。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

分类:有标签算法(监督学习)

聚类:无标签算法(无监督学习)

聚类主要思想:类内距离最小,类间距离最大。

K-means:将数据集算法将输入数据集D聚成K个簇,然后输出聚簇代表集合C(k个,即中心点),聚簇成员向量M。

步骤:确定k,选择k个聚类中心,将数据集的元素就近分配到k个簇中,更新k个簇的聚类中心,再重复分配元素,直聚类中心不再改变为止。

局限性:K-均值算法依赖于初始值的选取,仅能取得局部最优解,未必能得到全局最优解。

困难:参数k的取值困难,对于噪声点敏感。

空聚类解决办法:m从最大的聚簇中随机选取一个点作为新的簇的代表。

数据要求:数值型。

缺失值:替换。

效率低。


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值