K-Means的中心初始化惯用方式是随机初始化。也就是说:从training set中随机挑选出K个
作为中心,再进行下一步的K-Means算法。
这个方法很容易导致收敛到局部最优解,当簇个个数(K)较小(2<K<10)时,我们可以重复
多次K-Means,记录下他们的每个的cost function的值(如下图),其中cost function最小的便是
最优聚类结果了。

本文探讨了K-Means聚类算法中常见的随机初始化方法,并指出了该方法容易导致算法收敛到局部最优解的问题。针对这一问题,文章提出了通过多次运行K-Means并选择具有最低代价函数值的结果作为最终聚类方案的方法。
K-Means的中心初始化惯用方式是随机初始化。也就是说:从training set中随机挑选出K个
作为中心,再进行下一步的K-Means算法。
这个方法很容易导致收敛到局部最优解,当簇个个数(K)较小(2<K<10)时,我们可以重复
多次K-Means,记录下他们的每个的cost function的值(如下图),其中cost function最小的便是
最优聚类结果了。

转载于:https://www.cnblogs.com/instant7/p/4149472.html
1774

被折叠的 条评论
为什么被折叠?