Purity: 聚类划分的purity为,其中K是聚类(cluster)的数目,m是整个聚类划分所涉及到的成员个数。 下表是对洛杉矶时报的3204篇文章进行k-means聚类的结果,k=6,label数=6。 python实现: def purity(cluster, labels, k, label_set): p = np.zeros((k, len(label_set))) purity = 0 for i in range(len(cluster)): p[int(cluster