多类不平衡数据集挖掘与AIS数据损坏检测
多类不平衡数据集挖掘
在处理多类不平衡数据集挖掘时,研究人员提出了一组平衡代理。这些代理基于多个最先进的二元分类器,并采用一对一(One-versus-One,OVO)策略来处理多类问题。它们既可以作为独立的分类器使用,也可以作为分类器集成中的组件(基分类器)。
为了更好地了解这些平衡代理的性能,研究人员进行了一系列的成对比较,使用了Wilcoxon匹配对检验。在显著性水平为0.05的情况下,从测试结果可以得出以下观察:
| 性能指标 | 比较结果 |
| ---- | ---- |
| 准确率(Accuracy) | DOMIN - M和FWSMOTE在统计上表现相同;DOMIN - M在统计上优于ADASYN - M、CSMOUTE - M和LAMO - M |
| Kappa指数 | DOMIN - M在统计上优于所有其他代理 |
| 平均召回率(Mean - Recall) | DOMIN - M在统计上优于所有其他代理 |
| MAUC | DOMIN - M和ADASYN - M在统计上表现相同;DOMIN - M在统计上优于FWSMOTE - M、CSMOUTE - M和LAMO - M |
| Gmean | DOMIN - M和ADASYN - M在统计上表现相同;DOMIN - M在统计上优于FWSMOTE - M、CSMOUTE - M和LAMO - M |
计算实验表明,在考虑的方法中,无论使用哪种性能指标,DOMIN - M都能保证最佳性能。ADASYN - M和FWSMOTE - M代理的性能紧随其后。这三个代理在寻找用于挖掘多类不平衡数据集