自适应信号处理中的非线性利用与西班牙语语音合成技术
1. 自适应信号处理中的非线性特性
在自适应信号处理中,非线性特性的研究至关重要。当 λ → 0 时满足一定条件,并且浊音语音似乎可由 λ 呈现“尖峰”行为的区域来指示。从相关图中可以发现,类似噪声的声音如 /z/(约在样本 2800 - 3200 处)和 /s/(约在样本 4100 - 4200 处)是线性的,这与该领域先前的研究结果一致。而像“trying”中的 /a/ 这类高度浊音的声音则更具非线性。
此外,还对喉电图信号与 λ 变化之间的相关性进行了研究。通过对从 APLAWD 数据库中随机选取的语音波形(男性说话者读字母“m”)进行模拟,发现语音和对应的喉电图波形以及 λ 在 CNLMS 和 CNNGD 混合组合输出处的演变存在一定关联。特别是在某些浊音语音期间,λ 的急剧变化和 Lx 波形导数(指示声门开启时刻)的变化似乎同时发生,不过这并不一定意味着混合滤波器能够检测声门开启时刻,只是表明这两个信号之间存在明确的关系,需要进一步研究。
2. 基于 HMM 的西班牙语语音合成系统
2.1 系统概述
基于隐马尔可夫模型(HMM)的文本到语音(HMM - TTS)合成是一种从训练好的统计模型生成语音的技术,该模型将基本语音单元的频谱、音高和时长一起进行建模。其目的是描述一个使用外部机器学习技术来提高表现力的西班牙 HMM - TTS 系统,并对系统性能进行客观和主观分析。
2.2 HMM - TTS 系统的训练与合成
HMM - TTS 系统分为训练和合成两个阶段,具体流程如下:
- 训练阶段
超级会员免费看
订阅专栏 解锁全文
324

被折叠的 条评论
为什么被折叠?



