4、语音源分析与视听语音处理技术概述

最新推荐文章于 2025-10-31 14:32:44 发布

seed

最新推荐文章于 2025-10-31 14:32:44 发布

阅读量8

点赞数

CC 4.0 BY-SA版权

分类专栏：非线性语音处理新视角文章标签：语音源分析视听语音处理声门流模型

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/seed/article/details/155061837

非线性语音处理新视角专栏收录该内容

31 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

语音源分析与视听语音处理技术概述

语音源分析相关技术

语音源分析在语音处理领域至关重要，近期研究主要围绕基于频谱相位或瞬时相位的方法展开。

声门流模型表示
- 深入研究声门流发现，声门流模型可用因果 - 反因果（混合相位）滤波器表示。这一发现为后续的语音分析和合成提供了新的理论基础。
- 时域和声谱域参数之间的联系得以建立，大多数时域声门流模型都有相应的方程，这有助于更准确地理解和处理声门流信号。
新的声门模型与语音表示方法
- 提出了一种用于语音合成的频谱域新声门模型——因果 - 反因果线性模型（CALM），为语音合成技术带来了新的思路。
- 利用声门流模型的混合相位特性，提出了零 Z 变换（ZZT）的语音表示方法。虽然该算法计算量较大，但能实现简单的语音分析和合成。通过与逆滤波进行源 - 声道分解的比较，发现 ZZT 在波形和频谱距离方面表现更优，并且可用于估计语音源的开放商和不对称系数。
声门闭合瞬间检测
- 声门闭合瞬间在时 - 频域对应特定的瞬时相位和幅度模式，这些模式可通过跨尺度的最大幅度线（LOMA）进行分析。LOMA 不仅能提供相应语音周期的能量信息，还可能有助于进一步分析声门波形的特性。
- 以图 23 为例，展示了从数据库句子中提取的短片段，图中从上到下依次为 EGG 信号、DEGG 信号、语音信号

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。