我看了很多资料,关于设置值很多都是的说一下,对于我这个半路出家的,不好理解,所以自己一个一个的去找,然后理解,就把解释写得更清楚一点。
K-Means有两个缺点:
1.K值需要指定
2.初始点选取
K-Means ++就是要解决第二个问题的。
- k 表示期望的聚类的个数。
- maxInterations 表示方法单次运行最大的迭代次数。
- runs 表示算法被运行的次数。K-means 算法不保证能返回全局最优的聚类结果,所以在目标数据集上多次跑 K-means 算法,有助于返回最佳聚类结果。