多分类器系统在对抗学习中的应用与SOCIAL算法研究
在模式识别领域,对抗环境下的分类问题一直是研究的热点和难点。在这样的环境中,对手会有意识地采取行动,限制或阻止准确的识别性能,例如恶意更改训练数据的标签。本文将深入探讨多分类器系统(MCS)在对抗学习中的应用,以及一种名为SOCIAL的算法如何解决训练数据标签损坏的问题。
1. SpamAssassin过滤器实验与MCS的鲁棒性
在垃圾邮件过滤任务中,研究人员使用SpamAssassin过滤器作为线性分类器进行了实验。基于之前的实验结果,他们考虑了由10个基分类器组成的集成,以及随机子空间法(RSM)中占整个特征集80%的特征子集。同时,还比较了SpamAssassin作为单一分类器时,使用默认权重值和统一权重值(+1表示与垃圾邮件特征相关, -1表示其他)的情况。
实验结果表明,使用统一权重的SpamAssassin具有最高的鲁棒性,但在无攻击的原始测试集上表现最差,因为它没有利用特征的判别能力信息。而逻辑回归(LR)和支持向量机(SVM)分类器得到的权重在无攻击时(m = 0)略优于SpamAssassin的默认权重,但在受到攻击时(m > 0),默认权重表现出更高的鲁棒性。这说明SpamAssassin开发者手动设置的默认权重确实能够提高其在攻击下的鲁棒性。
此外,实验还发现,多分类器系统(MCS)在分类器未受攻击时并不能提高分类准确率,但在受到攻击时,除了以SVM为基分类器的装袋法(Bagging)外,其他MCS方法都能提高鲁棒性。有趣的是,SpamAssassin的默认权重比装袋法、RSM和单一分类器都表现出更高的鲁棒性。
超级会员免费看
订阅专栏 解锁全文
852

被折叠的 条评论
为什么被折叠?



