kmeans之于模式识别,如同“hello world”之于C、之于任何一门高级语言。
算法的规格(specification)
在聚类问题(一般非监督问题)中,给定训练样本X={ x(1),x(2),…,x(N)}\mathcal X = \{x^{(1)},x^{(2)}, \ldots , x^{(N)}\}X={ x(1),x(2),…,x(N)},每个x(i)∈Rdx^{(i)}\in \mathbb R^dx(i)∈Rd。kmeans算法的职责在于将这NNN个样本聚类成kkk个簇(cluster, μ1,μ2,…,μk\mu_1,\mu_2,\ldots,\mu_kμ1,μ2,…,μ