摘要
有关Kmeans的介绍可以参见这篇博客:
K均值聚类算法及Matlab函数使用
Kmeans算法的缺陷
- 聚类中心的个数K 需要事先给定,但在实际中这个 K 值的选定是非常难以估计的,很多时候,事先并不知道给定的数据集应该分成多少个类别才最合适
- Kmeans需要人为地确定初始聚类中心,不同的初始聚类中心可能导致完全不同的聚类结果。
(1)第一种缺陷通常人为解决,例如假设有K=10(根据先验知识,尽量大些),进行第一次聚类,如果结果显示某一类中的样本过少,则K=K-1,重新进行聚类。

本文介绍了使用Scikit-learn进行KMeans机器学习时面临的挑战,如K值的选择困难和初始聚类中心的影响。在实际应用中,选择合适的类别数量K并不容易,而KMeans算法的聚类结果会因初始中心的不同而产生显著差异。
最低0.47元/天 解锁文章
636

被折叠的 条评论
为什么被折叠?



