K-means算法及Matlab实现

最新推荐文章于 2025-03-14 14:59:01 发布

白百万

最新推荐文章于 2025-03-14 14:59:01 发布

阅读量1.4k

点赞数 3

分类专栏：练手

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_41385248/article/details/83305795

版权

文章目录

方法介绍
算法介绍
K-means 优缺点
CODE
实验验证

K-MEANS CLUSTERING

方法介绍

K-means 是经典的聚类算法，也是数据挖掘十大经典算法之一。聚类思想就是无监督学习中将较为相似的数据归为一类的，正所谓“物以类聚，人以群分”，大约就是这样，而 K- means 就是聚类算法中最为简洁，高效的一种，他是用于在无监督学习中，在一群未标注的数据中寻找聚类(culster)和聚类中心(cluster center)的方法。

核心思想:选定 K 个聚类中心，通过算法不断迭代移动中心位置以极小化聚类集群内部的方差总和。

算法介绍

当我们给定了初始中心以后，K-means 算法交替进行两个步骤:
1、对每一个中心我们识别出比起别的任何聚类点离某个聚类点更近的子群。
2、计算出每个集群中的数据点的特征均值，这个均值向量就成为这个集群的新的中心。重复迭代这两步，直到算法收敛。

K-means 优缺点

优点:
1、计算时间短，收敛速度快。
2、需要调参的话就只要 K 一个参数。(iii) 容易解释。
缺点:
1、初始 K 值需要预先给定:而这个很大程度取决于经验，但是这个 K 值是否能正确选取，也决定了 K-means 能否有效率的正确分类。
2、K-means 相当依赖一开始选取的聚类中心，而开始的聚类中心是随机选取的也就是说有相当比例的只能取得局部最小值而无法取得全局最小值。
3、K-means 无法适用于所有的数据集类型。
4、对于过于离散的点和奇异点的聚类效果也不好。

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。