下面这篇博客中分类别 介绍了很多机器学习方法的评价指标,比较全面:
http://www.cnblogs.com/zhaokui/p/ml-metric.html
一、聚类结果的评价指标
1、Rand index 或者 Rand measure(兰德指数)
维基百科比较详细:https://en.wikipedia.org/wiki/Rand_index
兰德指数需要给定实际类别信息C,假设K是聚类结果,a表示在C与K中都是同类别的元素对数,b表示在C与K中都是不同类别的元素对数。评价同一object在两种分类结果中是否被分到同一类别。
2、ARI(Adjusted Rand index)
ARI 需要用到contingency table:
调整后的ARI为: