聚类的评价指标 Given Label 均一性,一个簇中只有一个类别的样本,就是之前的准确率,h完整性,同类别样本被划分到同一个簇中,就是之前的召回率,cV-Measure β是权重,越大越看重均一性。 轮廓系数 计算同簇内每一个样本到同簇内样本的平均距离,可以度量这个样本和其他同簇样本的相似性,平均距离越短越好。a计算一个簇内每一个样本到不同簇内所有样本的距离,不同簇的那些样本距离求平均,分别和不同簇中所有样本求距离平均,最小的那个,就是不相似性。b轮廓系数: 越接近1,说明聚类合理 越接近-1,说明聚类不合理 越接近0,说明在簇类的边界上