机器学习在异常检测与裂缝表征中的应用
1. 异常检测技术分析
在数据处理中,异常检测是一项重要任务。有四种无监督异常检测技术(ODT)常被用于分析,分别是隔离森林(IF)、一类支持向量机(OCSVM)、局部异常因子(LOF)和DBSCAN。
1.1 评估指标
为了评估这些技术的性能,使用了多种简单的评估指标,如平衡准确率得分、F1得分、接收者操作特征(ROC)曲线、精确率 - 召回率(PR)曲线以及曲线下面积(AUC)。
- ROC - AUC得分 :ROC - AUC得分考虑了召回率和特异性,但未考虑精确率。以LOF为例,其ROC - AUC得分显示出一般的性能,但这并不意味着它表现不佳。
- PR - AUC得分 :PR - AUC得分在考虑精确率的情况下,能更全面地评估模型。LOF的PR - AUC得分很低,这表明大量原本的内点被错误地检测为异常点,其异常检测结果不可信。
1.2 不同技术的性能比较
通过对四个带有异常/内点标签的测井数据集进行比较研究,得到了不同技术在数据集#4上的PR - AUC和ROC - AUC得分,如下表所示:
| 技术 | PR - AUC得分 | ROC - AUC得分 |
| — | — | — |
| 隔离森林 | 0.89 | 0.98 |
| 一类支持向量机 | 0.88 | 0.99 |
| 局部异常因子 | 0.37 | 0.73 |
从表中可以看出,隔离森林和一类支持向量机的表现较好,而局部异常因子的表现较差。
超级会员免费看
订阅专栏 解锁全文
4161

被折叠的 条评论
为什么被折叠?



