8、声音场景与事件的声学和心理声学探秘

声音场景与事件的声学和心理声学探秘

1. 听觉对声源速度的估计

听觉系统在估计物体速度方面有着独特的机制。有两种理论解释了听觉系统如何估计运动物体的速度。一种是通过在不同时刻估计声源的位置(即“快照”),然后比较移动的距离和所用时间。另一种则是利用直接指示方位(间接指示速度)的声学线索,如双耳时间差、多普勒频移和响度变化。心理声学研究证实,听众会利用这些不同的线索来判断声源速度。

当有明确信息时,听众会直接使用,比如冲击时的内摩擦系数、多普勒频移等。而当相关信息不完整时,他们可能会采用一些通常并非最优,但能提供大致近似的策略。

2. 声音识别的最小和稀疏特征

2.1 频谱区域、最短持续时间和频谱 - 时间调制

对于语音刺激,即使听觉刺激被严重扭曲和修改,仍可被识别。例如,使用噪声带声码器方法处理语音,语音依然可辨。近期,Gygi 等人将同样的技术应用于环境声音,确定了识别所需的重要频谱 - 时间区域。虽然效果不如语音显著,但研究表明,高度滤波的环境声音也能被识别,且识别所需的频率区域与语音相似,只是环境声音识别可能需要更多高频信息。不过,识别结果因环境声音的不同而有很大差异,这是由于环境声音的声学变异性较大。

为了避免研究环境声音的困难,Patterson 提出了脉冲 - 共振(如语音或旋律音乐)和噪声声音的有用区分。未来的研究可能会从这种区分中受益,因为不同类型的声音可能具有不同的特征。

许多研究通过对信号或任务施加多种约束,来系统地研究声音识别的有用特征。其中,时间约束(即门控)是一种常见的方法,主要应用于脉冲 - 共振声音(如语音和音乐)。例如,1942 年 Gray 提出的“音素显微切割”技术,他提取

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值