文章工作:用GAN网络生成伪异常样本,结合已有正常样本,把异常检测转化为一个二分类任务
贡献1: 本文提出用GAN作为异常样本的生成器,使生成的异常是有意义的异常。(针对问题:为了应对高维空间中异常样本的稀疏性)
贡献2:把单生成器-单判别器的GAN网络,扩展成多生成器-单判别器的GAN网络,每个生成器在一个正常样本的子集上进行训练。(针对问题:单个GAN网络作为伪异常生成器容易过拟合:生成的伪异常侵入了正常样本的内部--模式崩溃)
(贡献3):正常样本被划分为不同子集的方式:相似的样本应该有相似的特征,从而特征相近的样本应该是相似的。根据判别器D的输出特征,在样本空间对样本进行聚类,从而把训练集划分成不同的子集。
解释:这里说的“有意义的异常”是与空间中的随机采样得到的异常样本相比较。在样本空间中随机采样得到的异常样本,可能距离正常样本非常远,这些异常被称为是无意义的,因为它们无助于使模型学到更紧凑的正常样本分类边界。有意义的异常是指:分布在正常样本的外部,但是又距离正常样本非常近,有助于二分类器学习到正常样本紧凑边界的异常。
文章介绍了一种使用GAN网络生成伪异常样本的方法,通过这种方式将异常检测问题转换为二分类任务。具体而言,作者提出了一个多生成器-单判别器的GAN网络结构,并通过将正常样本划分成多个子集来训练不同的生成器,以此避免模式崩溃并提高异常样本生成的质量。
3024

被折叠的 条评论
为什么被折叠?



