非平稳自洽声学对象作为浊音语音的基本单元
1 同步概念与基础驱动
1.1 同步概念
在同步概念中,代数关系可能局限于驱动和响应的相位。相位同步或锁相是非线性耦合驱动 - 响应(DR)动力学的一般特性。由于主响应的频率范围更广,耦合函数表现为不可逆(多模态)函数。广义同步的一个重要特殊情况是,可逆耦合函数描述了两个拓扑等价(表现得像单个振荡器)的振荡器之间的耦合。
1.2 基础驱动(FD)的历史与作用
早期认为,浊音语音、歌曲和音乐的高频声学模式及其音高感知与音高频率范围内的单个(声学)模式存在因果联系,这一观点可追溯到拉莫。但塞贝克表明,虚拟音高感知并不依赖于所听到信号中的基础声学模式。众多基于稳态浊音信号的研究显示,虚拟音高感知依赖于多个子带或分音的谐波相关频率的子带分解。
本研究用抽象的“序参数”FD取代了拉莫的基础音,FD通过谐波相关的分音获得,可确认为声源声门主振荡器的拓扑等价图像,并且与非平稳虚拟音高感知的声学相关物密切相关。
在初步研究中,已证明并比较了从浊音语音信号以及同时记录的电声门图在接收端重建FD的原理可行性。受当前对耳蜗功能解释的启发,FD的提取基于具有时间独立中心滤波频率(在当前分析窗口内)的分音。然而,这种对时间不变滤波频率的限制导致非平稳浊音语音的分音,无法精确关联到发射端声道中的相应声学模式。
引入分音滤波器的自洽滤波频率轮廓,为重建共振峰特定声学模式的拓扑等价图像提供了可能。高频共振峰图像特别适合重建基础驱动的瞬时频率。虽然共振峰振荡器图像的拓扑等价性确认仅限于约30 - 40 ms的分析窗口,但对于不间断的浊音语音段,即超过100 ms的时间段,可实现连贯FD
超级会员免费看
订阅专栏 解锁全文
7

被折叠的 条评论
为什么被折叠?



