k均值聚类算法优缺点_机器学习经典算法之k-means聚类

K-means是一种广泛应用的聚类算法,通过寻找最小化簇内平方和的质心来将样本分为K个簇。算法对初始质心的选择敏感,对球形簇效果好,但对非凸、不同尺寸和密度的簇处理不佳。k-means++初始化方法有助于改善结果。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

聚类就是将某个数据集中的样本按照之间的某些区别划分为若干个不相交的子集,我们把每个子集称为一个“簇”。划分完成后,每个簇都可能对应着某一个类别;需说明的是,这些概念对聚类算法而言事先是未知的,聚类过程仅能自动形成簇结构,簇对应的概念语义由使用者来把握和命名。

有关聚类的算法很多,下面这张表格引用自Scikit-learn 官方文档,从这张表中可以看到各个聚类算法之间的不同以及对不同数据及划分时的匹配程度,和优劣性。我们在选择聚类算法的时候,首先一定要熟悉自己的数据,大概了解自己的数据是怎样的一个分布和结构。这样,有利于我们选择合适的算法,从而得到优秀的聚类结果。这篇文章仅仅介绍K-means聚类算法,以及它的推广版K-mean++算法。

e047db15de27063b22a3fdc4616f5c06.png
29c3c17212aaf00ef731d38ce74fda59.png
449586f05e744fe1f2e09e96ce7e9498.png

k-means算

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值