k-mean算法
给定m个数据样本x1,x2…xm,每个样本可以看作n维空间中的一个点,假设需要将m个数据样本聚成k个类,k均值算法的基本思想是:选取Rn中的k个点,c1,c2…ck,并将每个数据样本分配至与其距离最近的中心,使得所有样本到分配到的中心的距离之和最小,这样一来,分配到同一中心的样本就聚成一类,采用这种方法,就可以将m个样本聚成k个类。
按照上述的思想,算法的关键之处是选取数据样本的k个中心。然而,在计算复杂性理论中已经证明,k中心问题时一个NP(NP-hard)的问题。在这种情况下,k均值算法就采用迭代的方.
原创
2020-12-12 11:19:20 ·
332 阅读 ·
0 评论