82、计算听觉场景分析:模拟人类听觉表现的模型探索

计算听觉场景分析:模拟人类听觉表现的模型探索

1. 计算听觉场景分析概述

在听觉研究中,存在两种不同的研究途径。一种是旨在理解人类听觉处理器,通过构建计算模型来模拟各种听觉现象,从而估算模型参数的作用,探索声音产生事件的声学特性与感知到的声音结构之间的关系。另一种途径则不依赖于对人类听觉处理的了解,常用于实际应用开发,例如从复杂混合声音中分离出单一声音信号。像语音识别系统需要从干扰声音中挑选出特定说话者的语音,或者机器人要在嘈杂环境中导航并对语音指令做出响应等场景。

若研究目标是打造性能最优的系统,可能会尝试超越人类听觉能力,比如使用多于两个麦克风记录声音,或在记录中纳入次声波或超声波,以规避人类感知系统的局限。这类系统的性能相对容易定义,例如在声音定位中,声音位置估算越接近实际声源位置,系统性能越好。但人类听觉在某些情况下与技术系统的判断有所不同,如一个声音通过两个不同扬声器播放时,技术系统会定位到两个不同声源,而人类通常会觉得声音来自两个扬声器中间;当一个扬声器同时播放两种不同旋律时,技术系统会识别为一个声源,而人类能分辨出两个。

接下来将重点关注模拟人类听觉表现的系统。听觉场景分析(ASA)受多种因素影响,为定量确定这些因素的影响,最佳方法之一是构建定量模型来预测感知实验结果,通过改变模型参数,测量其对模型输出的影响,并与受控感知实验结果进行对比。

计算听觉场景分析领域的文献丰富,周边听觉系统多由听觉滤波器组建模,而中央处理过程常涉及更专业的系统,如隐马尔可夫模型、最优处理器或连接主义网络等。该领域的相关研究众多,如Blauert和Braasch、Brown、Cooke和Ellis等学者都有涉及;语音与竞争声音分离方面,Divenyi、Haykin和Ch

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值