无监督离群点检测技术的评估指标与性能分析
1 无监督离群点检测的评估指标
在无监督离群点检测(ODT)中,有多个重要的评估指标用于衡量模型的性能。
1.1 特异性(Specificity)
特异性确保内点不会被错误地标记为离群点,它应与召回率(Recall)一起使用来评估模型性能。理想情况下,我们希望召回率接近 1,特异性也接近 1。但仅高特异性并不意味着无监督 ODT 性能良好。例如,若模型将每个数据点都检测为内点,特异性为 1,但召回率为 0,说明无监督 ODT 性能不佳。
1.2 平衡准确率得分(Balanced accuracy score)
平衡准确率得分是特异性和召回率的算术平均值,是一个更好的指标,因为它将两者结合为一个单一指标来评估离群点检测模型的性能。其计算公式为:
[
\text{Balanced accuracy score} = \frac{\text{Recall} + \text{Specificity}}{2}
]
其值范围从 0 到 1,1 表示一个完美的 ODT,能正确检测数据集中的所有内点和离群点。例如,对于包含 1000 个内点和 100 个离群点的数据集,当无监督 ODT 模型将每个样本都检测为离群点时,召回率为 1,特异性为 0,平衡准确率得分为 0.5。当数据中大部分离群点和内点分别被准确检测为离群点和内点时,平衡准确率得分较高。
1.3 精确率(Precision)
精确率衡量无监督 ODT 分配的离群点标签的可靠性,它表示所有预测的离群点中正确预测的离群点的比例。数学表达式为:
[
超级会员免费看
订阅专栏 解锁全文
856

被折叠的 条评论
为什么被折叠?



