人类声音定位中多信息源的整合
在人类的听觉感知中,声音定位是一个复杂而精妙的过程,它涉及到多种信息源(SOIs)的综合利用。这些信息源相互作用,共同决定了我们对声音位置的感知。
1. 声音定位的复杂性
声音定位并非总是准确和直接的。有些情况下,声音源难以定位,比如在混响房间里的连续3kHz音调,我们很难判断其来源方向。而在另一些情况下,听众感知到的声音位置并非其实际位置,而是受声音的声学变量(如频率)影响。例如,外部声源被内化,或者纯音的感知高度并非其实际高度,就像普拉特效应所展示的那样。不过,也有一些声音源能够被非常准确地定位,比如在正常混响房间里熟悉声音的真人说话者。
人类声音定位所涉及的信息源,没有一个能在超过两个维度上明确指定声音源的位置。因此,听众总是需要多个信息源才能准确地定位声音源。每个信息源在一定程度上限制了声音源可能被感知的空间,这个空间可能包含实际位置,也可能是默认感知位置、虚拟位置、基于视觉或其他感官信息的位置,或者是预期声音来源的位置。这个空间可能相对较小,意味着感知位置明确;可能局限于空间中的两个区域,如前后混淆的情况;也可能相当分散;还可能在不同区域之间切换,或者呈现多稳态。而且,不同听众的实际感知可能有很大差异。
虽然很难对声音定位中所有因素的相互作用以及最终如何确定声音源的感知位置得出明确结论,但可以提出一些一般性假设:
- 没有一个声学信息源能单独指定声音源的感知位置。
- 在缺乏特定信息时,声音可能在默认的距离、方位和高度被感知,这些默认值可由先前感知的位置、其他感官模态(如视觉系统)的信息以及基于早期经验的预期来设定。
- 听觉系统的整个音调拓扑阵列都可用于听觉定位。
- 听觉系统会
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



