1.一些概念
对于给定的数据集D,将D聚类成k个簇c1,c2,...ck;
k-均值算法用簇ci的型心代表簇,把簇型心定义为簇内点的均值,
对象p到型心ci的距离用欧式距离度量dist(p,ci),
簇ci的质量用簇内变差度量,它是ci中所有对象和形心ci之间的误差的平方和,定义为:
E=∑k
1.一些概念
对于给定的数据集D,将D聚类成k个簇c1,c2,...ck;
k-均值算法用簇ci的型心代表簇,把簇型心定义为簇内点的均值,
对象p到型心ci的距离用欧式距离度量dist(p,ci),
簇ci的质量用簇内变差度量,它是ci中所有对象和形心ci之间的误差的平方和,定义为:
E=∑k