机器学习的评价指标-Rand index

最新推荐文章于 2024-08-20 17:06:30 发布

原创最新推荐文章于 2024-08-20 17:06:30 发布 · 1.1w 阅读

22 ·

CC 4.0 BY-SA版权

机器学习专栏收录该内容

5 篇文章

订阅专栏

本文深入探讨了机器学习中的聚类评价指标，重点关注Rand Index（兰德指数）及其调整版本Adjusted Rand Index（ARI）。 Rand Index衡量了实际类别与聚类结果的一致性，而ARI通过校正随机分布的影响，提供了一个更可靠的比较标准，其值在[-1,1]之间，1表示完美匹配。这两种指标在无监督学习中用于评估聚类算法的效果，特别是在未知真实标签的情况下比较不同聚类模型的性能。" 129484127,12863582,STM32+ESP8266 温湿度上传到OneNet HTTP 实践教程,"['STM32开发', '物联网', '嵌入式硬件', 'ESP8266开发', '数据上传']

下面这篇博客中分类别介绍了很多机器学习方法的评价指标，比较全面：
http://www.cnblogs.com/zhaokui/p/ml-metric.html

一、聚类结果的评价指标
1、Rand index 或者 Rand measure（兰德指数）
维基百科比较详细：https://en.wikipedia.org/wiki/Rand_index
兰德指数需要给定实际类别信息C,假设K是聚类结果，a表示在C与K中都是同类别的元素对数，b表示在C与K中都是不同类别的元素对数。评价同一object在两种分类结果中是否被分到同一类别。
在这里插入图片描述
2、ARI（Adjusted Rand index）
ARI 需要用到contingency table：

调整后的ARI为：

调整后的ARI公式的每一部分代表的含义（与上面公式中max(RI) ,E(RI)的对应），可以参照这篇博客：
https://blog.youkuaiyun.com/qtlyx/article/details/52678895
ARI的实现及简单例子参照这篇博客：
https://davetang.org/muse/2017/09/21/adjusted-rand-index/