k均值聚类算法优缺点_机器学习经典算法之k-means聚类

最新推荐文章于 2024-10-27 09:23:18 发布

最新推荐文章于 2024-10-27 09:23:18 发布 · 3.4k 阅读

·

0

·

文章标签：

#k均值聚类算法优缺点 #聚类结果不好怎么办

K-means是一种广泛应用的聚类算法，通过寻找最小化簇内平方和的质心来将样本分为K个簇。算法对初始质心的选择敏感，对球形簇效果好，但对非凸、不同尺寸和密度的簇处理不佳。k-means++初始化方法有助于改善结果。

聚类就是将某个数据集中的样本按照之间的某些区别划分为若干个不相交的子集，我们把每个子集称为一个“簇”。划分完成后，每个簇都可能对应着某一个类别；需说明的是，这些概念对聚类算法而言事先是未知的，聚类过程仅能自动形成簇结构，簇对应的概念语义由使用者来把握和命名。

有关聚类的算法很多，下面这张表格引用自Scikit-learn 官方文档，从这张表中可以看到各个聚类算法之间的不同以及对不同数据及划分时的匹配程度，和优劣性。我们在选择聚类算法的时候，首先一定要熟悉自己的数据，大概了解自己的数据是怎样的一个分布和结构。这样，有利于我们选择合适的算法，从而得到优秀的聚类结果。这篇文章仅仅介绍K-means聚类算法，以及它的推广版K-mean++算法。

k-means算法是使用最广泛的聚类算法之一。聚类的目的是把相似的样本聚到一起，把不相似的样本分开。对于给定的样本集，按照样本之间的距离大小，将样本集划分为K个簇。让簇内的点尽量紧密的连在一起，而让簇间的距离尽量的大。

K-means算法旨在选择一

最低0.47元/天解锁文章

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。