9.均值聚类算法(k-means)
在聚类的问题中,我们得到了一组训练样本集 {
x(1),...,x(m)}\{x^{(1)},...,x^{(m)}\}{
x(1),...,x(m)},然后想要把这些样本划分成若干个相关的“类群(clusters)”。其中的 x(i)∈Rnx^{(i)}\in R^nx(i)∈Rn,而并未给出分类标签 y(i)y^{(i)}y(i) 。所以这就是一个无监督学习的问题了。
KKK 均值聚类算法如下所示:
- 随机初始化(initialize)聚类重心(cluster centroids) μ1,μ2,...,μk∈Rn\mu_1, \mu_2,..., \mu_k\in R^nμ1,μ2,...,μk