1. K-Means算法缺点 1)对k个初始质心的选择比较敏感,容易陷入局部最小值。如下面这两种情况。K-Means也是收敛了,只是收敛到了局部最小值。 2)k值得选择是用户指定的,不同的k得到的结果会有挺大的不同,如下图所示,左边是k=3的结果,蓝色的簇太稀疏了,蓝色的簇应该可以再划分成两个簇。右边的是k=5的结果,红色和蓝色的簇应该合并为一个簇 3)存在局限性,如下面这种非球状的数据分布就搞不定了。 4)数据量比较大的时候,收敛会比较慢。 2. K-Means算法优化<