25、德国HUI音频语料库:高质量TTS数据集与认知推理中的否定处理

德国HUI音频语料库:高质量TTS数据集与认知推理中的否定处理

德国HUI音频语料库介绍

在文本转语音(TTS)领域,德国HUI音频语料库是一个重要的资源。它是一个免费的、高质量的德语TTS数据集,由多个说话者的音频转录对组成,总时长超过300小时。此外,还包含一个满足高级质量标准的“干净”子集。

相关指标
  • 静音比例平均值(SPA) :通过均方根(RMS)将每个音频片段分为静音和语音部分,测量每个音频片段的静音比例,并在整个数据集上取平均值。括号内的值表示数据的标准差。
  • 唯一单词计数(UW@1) :转录文本中出现的所有唯一单词的计数,描述了转录文本的多样性,值越大表示对德语词汇的覆盖范围越广。
  • 出现至少五次的唯一单词计数(UW@5) :转录文本中至少出现五次的所有唯一单词的计数,是UW@1指标的扩展。数据集中唯一单词的频率越高,一次性发音不佳的单词对TTS模型训练过程的影响就越小。
完整子集和干净子集概述
子集 说话者 时长(小时) 数量 MVA SPA UW@1 UW@5
Bernd Ungerer ♂
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值