22、非平稳自洽声学对象作为浊音语音的基本单元

最新推荐文章于 2025-11-16 23:08:18 发布

seed

最新推荐文章于 2025-11-16 23:08:18 发布

阅读量9

点赞数

CC 4.0 BY-SA版权

分类专栏：非线性语音处理新视角文章标签：非平稳自洽声学对象浊音语音基础驱动

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/seed/article/details/155061975

非线性语音处理新视角专栏收录该内容

31 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

非平稳自洽声学对象作为浊音语音的基本单元

1 同步概念与基础驱动

1.1 同步概念

在同步概念中，代数关系可能局限于驱动和响应的相位。相位同步或锁相是非线性耦合驱动 - 响应（DR）动力学的一般特性。由于主响应的频率范围更广，耦合函数表现为不可逆（多模态）函数。广义同步的一个重要特殊情况是，可逆耦合函数描述了两个拓扑等价（表现得像单个振荡器）的振荡器之间的耦合。

1.2 基础驱动（FD）的历史与作用

早期认为，浊音语音、歌曲和音乐的高频声学模式及其音高感知与音高频率范围内的单个（声学）模式存在因果联系，这一观点可追溯到拉莫。但塞贝克表明，虚拟音高感知并不依赖于所听到信号中的基础声学模式。众多基于稳态浊音信号的研究显示，虚拟音高感知依赖于多个子带或分音的谐波相关频率的子带分解。

本研究用抽象的“序参数”FD取代了拉莫的基础音，FD通过谐波相关的分音获得，可确认为声源声门主振荡器的拓扑等价图像，并且与非平稳虚拟音高感知的声学相关物密切相关。

在初步研究中，已证明并比较了从浊音语音信号以及同时记录的电声门图在接收端重建FD的原理可行性。受当前对耳蜗功能解释的启发，FD的提取基于具有时间独立中心滤波频率（在当前分析窗口内）的分音。然而，这种对时间不变滤波频率的限制导致非平稳浊音语音的分音，无法精确关联到发射端声道中的相应声学模式。

引入分音滤波器的自洽滤波频率轮廓，为重建共振峰特定声学模式的拓扑等价图像提供了可能。高频共振峰图像特别适合重建基础驱动的瞬时频率。虽然共振峰振荡器图像的拓扑等价性确认仅限于约30 - 40 ms的分析窗口，但对于不间断的浊音语音段，即超过100 ms的时间段，可实现连贯FD

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。