有限域语音合成的最小文本语料库选择
在语音合成领域,构建合适的文本语料库至关重要。对于有限域语音合成来说,目标是选择包含尽可能多可能单元(从语音和韵律上下文角度)且出现次数足够大或可管理的文本材料,以实现自然流畅的语音合成。
有限域文本表示
有限域文本的表示形式多样,取决于领域的大小和文本的变异性。
- 严格受限领域 :具有固定的句子结构,包含可变项(插槽)和可填入的单词集合。例如火车出发和到达信息自动系统,其文本结构固定,部分内容可变。
- 示例:
- “Jak vám mohu pomoci?”(你需要什么帮助?)
- “V kolik hodin chcete jet ze stanice Rokycany do stanice Strakonice?”(你想几点从罗基卡尼站前往斯特拉科尼采站?)
- 更广泛的有限领域 :文本变异性更大,如天气预报、空中交通管制(ATC)通信记录、机场终端信息系统(ATIS)等。以ATIS为例,其短语结构多变,固定文本框架更短。
- 示例:
- “WIND CALM.”(风平浪静。)
- “WIND 120 DEGREES 3 KNOTS BETWEEN 060 AND 150 DEGREES.”(风向120度,风速3节,风向在60度至150度之间。)
从给定文本中提取待记录文本的方法主要有以下三种:
|方法|优点|缺点|
| ---- | ---- | ---- |
|记录所有可用句子|无需拼接,理论上所有可能句子都在语料库中,回放自然度最高|语音语料库庞
超级会员免费看
订阅专栏 解锁全文
11万+

被折叠的 条评论
为什么被折叠?



