音色感知的维度分析
1. 音色感知及维度分析概述
音色被定义为既非响度、亦非音高和时长的声音听觉属性,这使得难以定义简单的声学关联来描述它。而且,用于描述声音的词汇众多,表明音色空间并非一维甚至低维的。鉴于非线性、迟滞和上下文效应,涵盖所有可能音色的通用音色空间可能根本不存在度量。不过,某些类别的声音子空间可近似为有限维度的空间。
计算这些空间需要复杂的程序,主要技术包括:
- 频谱图 :1945 年引入,可用于元音和乐器声音等的分析。
- 多维标度法(MDS) :用于研究音色空间。
- 声音的语言属性分析 :辅助对音色的研究。
下面将重点讨论元音声音和乐器声音的音色子空间,这里先着重阐述元音声音的音色空间。
2. 元音声音的音色空间
2.1 元音的频谱 - 时间分析与共振峰
随着频谱图的出现,对口语元音进行频谱 - 时间分析成为可能。频谱图能清晰显示变化的共振峰,即声道的共振,表现为“在模式中穿梭的暗带”。共振峰通常按频率从低到高编号为 F1、F2、F3 等。可以将人类声道建模为半开管来描述共振峰,若半开管各处横截面积相等,其共振频率可表示为((2k - 1) c / (4L))((k = 1, 2, 3, \cdots)),其中(c)是声速,(L)是管道长度。男性声道长度约 17 厘米,女性约 13 厘米,因此男性声道的共振频率是 500 Hz 的奇数倍,女性是 660 Hz 的奇数倍。当横截面积不同时,共振频率会相应改变,在人类语音中,这是由于发音器官(如颌、舌和唇
超级会员免费看
订阅专栏 解锁全文
65

被折叠的 条评论
为什么被折叠?



