德国HUI音频语料库:高质量TTS数据集与认知推理中的否定处理
德国HUI音频语料库介绍
在文本转语音(TTS)领域,德国HUI音频语料库是一个重要的资源。它是一个免费的、高质量的德语TTS数据集,由多个说话者的音频转录对组成,总时长超过300小时。此外,还包含一个满足高级质量标准的“干净”子集。
相关指标
- 静音比例平均值(SPA) :通过均方根(RMS)将每个音频片段分为静音和语音部分,测量每个音频片段的静音比例,并在整个数据集上取平均值。括号内的值表示数据的标准差。
- 唯一单词计数(UW@1) :转录文本中出现的所有唯一单词的计数,描述了转录文本的多样性,值越大表示对德语词汇的覆盖范围越广。
- 出现至少五次的唯一单词计数(UW@5) :转录文本中至少出现五次的所有唯一单词的计数,是UW@1指标的扩展。数据集中唯一单词的频率越高,一次性发音不佳的单词对TTS模型训练过程的影响就越小。
完整子集和干净子集概述
| 子集 | 说话者 | 时长(小时) | 数量 | MVA | SPA | UW@1 | UW@5 |
|---|---|---|---|---|---|---|---|
| Bernd Ungerer ♂ |
超级会员免费看
订阅专栏 解锁全文
2438

被折叠的 条评论
为什么被折叠?



