Acoustic Event Classification using Graph Signals

本文提出一种新的声学事件分类(AEC)方法,该方法从频谱图生成图像信号并从中提取特征。实验结果显示,在噪声条件下,该方法相较于梅尔频率倒谱系数(MFCC)具有更高的识别准确性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

摘要

本文从频谱图生成图形信号,并根据图形信号作为特征对声学事件进行分类(AEC)。从RWCP的声场数据库中选择不同的声音事件。从NOISEX'92数据库中选择三种不同的噪声,并分别添加到不同噪声条件下的测试样本。比较使用提出的特征和梅尔频率倒谱系数(MFCC)分别在干净的和有噪声试验样本的声音事件的识别性能。在噪声条件下,所提出的特征显示出相对于MFCC的识别精度显着提高。

索引术语-AEC,谱图特征,时频(TF)表示(TFR),图形信号。

介绍

在大自然中,每个环境周围都有自己的一套声音。例如,电视,风扇,水龙头流水,振铃电话产生的声音属于环境“家”。存在于特定环境中的声音被称为声音事件。声音事件分类(AEC)是从预先训练的标签集合中识别声音片段标签的过程[1]。它具有许多应用,如城市声音识别[2],自动噪声源识别[3],基于声音的个人智能档案[4]等。用于语音/说话人识别的时间特征,频谱特征可能不适用于AEC。因此,识别AEC特有的新功能是一项具有挑战性的任务。文献中报道的一些作品表明,时频表示(TFR)的组合时频(TF)特征对于AEC比梅尔频率倒谱系数(MFCC)更好。在[5] [6]中,时频特征用匹配追踪算法提取。在[7]中,非负矩阵分解因式被用于从匹配追踪时频特征分布中提取时频特征。事件的时频特征也从频谱图中提取[8]。从频谱图中评估事件的关键频谱特征具有较高的计算成本。

这篇文章中,提取了包含事件和非事件的子空间的信号的对数谱。从对数谱中提取一维图像信号。事件中的高能量的频谱元素从图形信号中提取并作为特征。将支持向量机用于声音事件分类(SVM)。用三种不同的噪声环境测试这种特征的鲁棒性,并且与基线系统MFCC做比较。

其余的论文组织如下。第二节涵盖了所提出的方法的详细解释。结果在第三节中讨论。第四节总结了这项工作。

总结

本文提出了一种基于图像信号的AEC提取方法。图形信号由50 ×50时频特征矩阵生成。通过评估每帧中的局部最大值和噪声并将它们视为特征,从图形信号中提取属于事件的高能谱分量。使用干净的测试样品可获得98.5%的识别准确度。它表明提出的特征对声学事件的识别有重要贡献。在噪声条件下,提出的特征优于MFCC。因此,提出的功能更具鲁棒性。从图信号中识别不同的特征,对噪声鲁棒,并且微调阈值以从图信号中选择事件,特别是在噪声条件下可以进一步提高识别精度。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值