西班牙语音合成中HMM与CBR的融合及情感语音语料库评估
在语音合成技术不断发展的今天,如何提高合成语音的质量和表现力是研究的重点方向。本文将探讨西班牙语音合成中基于隐马尔可夫模型(HMM)和基于案例推理(CBR)的融合方法,以及对情感语音语料库的客观和主观评估。
1. HMM与CBR融合的西班牙语音合成
在西班牙语音合成中,对HMM和CBR两种系统在基频(F0)轮廓和音素时长方面的均方根误差(RMSE)进行了评估。
- F0轮廓RMSE评估
- 从图3(a)可以看出,除了疑问句的情况,CBR和HMM系统在F0轮廓的表现上较为相似。对于疑问句,短句子的表现更差,如图3(b)所示。
- 例如,在分析不同类型的短语时,发现对于一些特定的短语类型,两种系统的性能有所差异。
-
音素时长RMSE评估
- HMM和CBR系统在音素时长的RMSE方面表现相似,但疑问句在HMM系统下表现更差,而非常长的句子(VL)在CBR系统下表现更差,如图4所示。
- 具体来说,在不同长度的短语中,音素时长的估计会受到系统类型的影响。
-
实际示例分析
- 以图5(b)中的实际例子为例,对于短陈述句部分(帧数 < 350),HMM和CBR估计的F0轮廓相似。但对于短疑问句部分(帧数 > 350),CBR方法更优,因
超级会员免费看
订阅专栏 解锁全文
3312

被折叠的 条评论
为什么被折叠?



