12、基于预测自编码器的上下文感知无监督异常声音检测

基于预测自编码器的上下文感知无监督异常声音检测

1. 引言

异常声音检测(ASD)是一项用于检测给定机器发出的声音片段是否异常的声学任务。近年来,由于该技术可广泛应用于工业机器的自动监测,ASD 受到了越来越多的关注。然而,异常事件多样且罕见,收集足够的异常声音数据成本高昂。通常,开发 ASD 系统时仅提供正常数据,这也是 ASD 极具挑战性的原因之一。自 2020 年以来,DCASE 挑战赛设置了无监督 ASD 任务以吸引更多研究。

ASD 系统通过无监督学习对正常数据的分布进行建模。将声音属于该分布的概率作为判别标准,从而从大量正常数据中检测出异常。目前已提出多种 ASD 方法,可分为判别式和生成式方法。判别式方法将异常检测的二元分类任务转化为机器 ID 识别问题,借助神经网络的表示学习能力,这些方法取得了较好的性能。生成式方法主要通过计算生成输出与输入特征之间的误差来检测异常,包括 GAN 和 Flow 等。自编码器(AutoEncoder)也是无监督生成式方法之一,在此基础上,提出了插值深度神经网络(IDNN)、条件自编码器(CAE)和注意力神经过程(ANP)等方法。这些基于 AE 的方法更关注局部细节,主要依赖帧内的内容信息。

然而,判别式方法仅适用于部分异常检测任务,因为存在没有机器 ID 标签的数据。虽然基于 AE 的生成式方法适用于无监督 ASD,但由于深度神经网络(DNN)的局限性,它们破坏了帧之间的关系,并且限制了输入长度,导致对长时输入的建模能力不足。而时间关联已被证明对各种声学任务有效,因此在 ASD 中应合理利用帧之间的关系。

本文聚焦于通用的基于 AE 的方法,引入 Transformer 到无监督异常声音检测中,提出了预测自编码器

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值