下面这篇博客中分类别 介绍了很多机器学习方法的评价指标,比较全面:
http://www.cnblogs.com/zhaokui/p/ml-metric.html
一、聚类结果的评价指标
1、Rand index 或者 Rand measure(兰德指数)
维基百科比较详细:https://en.wikipedia.org/wiki/Rand_index
兰德指数需要给定实际类别信息C,假设K是聚类结果,a表示在C与K中都是同类别的元素对数,b表示在C与K中都是不同类别的元素对数。评价同一object在两种分类结果中是否被分到同一类别。

2、ARI(Adjusted Rand index)
ARI 需要用到contingency table:

调整后的ARI为:


调整后的ARI公式的每一部分代表的含义(与上面公式中max(RI) ,E(RI)的对应),可以参照这篇博客:
https://blog.youkuaiyun.com/qtlyx/article/details/52678895
ARI的实现及简单例子参照这篇博客:
https://davetang.org/muse/2017/09/21/adjusted-rand-index/
ARI的优点:
- 随机均匀的标签分布的ARI值接近0,这点与raw Rand Index和 V-measure指标不同;
- ARI值的范围是[-1,1],负的结果都是较差的,说明标签是独立分布的,相似分布的ARI结果是正的,1是最佳结果,说明两种标签的分布完全一致;
- 不用对聚类结果做任何假设,可以用来比较任意聚类算法的聚类结果间的相似性。
ARI的缺点:
- ARI指标需要事先知道样本的真实标签,这和有监督学习的先决条件是一样的。然而ARI也可以作为一个通用的指标,用来评估不同的聚类模型的性能。
本文深入探讨了机器学习中的聚类评价指标,重点关注Rand Index(兰德指数)及其调整版本Adjusted Rand Index(ARI)。 Rand Index衡量了实际类别与聚类结果的一致性,而ARI通过校正随机分布的影响,提供了一个更可靠的比较标准,其值在[-1,1]之间,1表示完美匹配。这两种指标在无监督学习中用于评估聚类算法的效果,特别是在未知真实标签的情况下比较不同聚类模型的性能。"
129484127,12863582,STM32+ESP8266 温湿度上传到OneNet HTTP 实践教程,"['STM32开发', '物联网', '嵌入式硬件', 'ESP8266开发', '数据上传']
2万+

被折叠的 条评论
为什么被折叠?



