41、基于显著变化测量的环境声音识别

基于显著变化测量的环境声音识别

1. 现有环境声音识别成果

在环境声音识别领域,已有不少研究取得了一定成果。部分识别准确率如下:街道(交通)93%、公交车81%、建筑工地100%、办公室100%、讲座100%、城市汽车100%、购物中心89%、街道(人群)100%、超市100%、洗衣店90%、高速公路汽车98%以及火车99%。

有研究使用匹配追踪算法和MFCC,还尝试将高斯混合模型(GMM)与K近邻(KNN)分类器结合。对于餐厅内部、操场、三种类型街道、火车经过、车内、赌场内部、白天自然环境、夜间自然环境、海浪、流水/溪流/河流、降雨/阵雨和打雷等环境,使用GMM的平均准确率约为83.94,使用KNN的平均准确率为77.3。还有研究使用MFCC加上时间和频率特征,结合贝叶斯分类器和隐马尔可夫模型(HMM),得到了不同活动的(%精度 - %召回率)对,如步行93 - 53、驾驶汽车100 - 100、乘坐电梯78 - 80、乘坐公交车25 - 90。该方法采用了分层架构,包括音乐、语音和环境声音三个粗分类以及更细的子分类,还考虑了手机设计并提出了个性化的类别聚合。

然而,目前提到的研究都未解决声音在信号混合中重叠时的环境声音分析问题。盲源分离虽能识别不同声源,例如通过独立成分分析(ICA),但它需要与待识别声源数量对应的固定数量传感器。因此,在本研究中,由于将音频视为来自单一源,无法使用该技术。

近期有研究通过无监督非负矩阵分解(NMF)对声音进行源分离预处理,以解决混合重叠信号的识别问题,生成分离的音轨。然后使用MFCC对音轨进行特征提取,最后用三状态HMM进行分类。报告结果显示,在整体上下文实验中使用的F分数为52.6,F分数的计算公式为:
[Fs

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值