希腊语语言资源评估与去标识语音可懂度评估
在语言技术领域,语音识别、合成以及去标识等技术是研究的热点。本文将围绕希腊语语言资源评估以及去标识语音的可懂度评估展开,探讨相关技术的现状、问题与发展方向。
希腊语语言资源评估
在支持希腊语的相关研究中,对维基百科语料库进行了分析。以下是初始双音素覆盖分布及手动选择前后相应的句子数量:
| 覆盖情况 | 句子数量 | 双音素覆盖 |
| — | — | — |
| 初始 | 13,876 | 834 |
| 手动选择后 | 1,243 | 524 |
可以看出,手动选择后双音素覆盖数量明显下降。这表明双音素覆盖度较低,尤其是在手动选择之后。与其他研究相比,本研究中手动选择后不同双音素的数量降至 524,几乎是其他研究中实现数量的一半。
在语调覆盖方面,简单的语调覆盖算法没有区分不同类型的问题或极性差异。然而,在许多语言中,如英语和希腊语,特殊疑问句和一般疑问句有明显的音韵旋律,这一基本区别需要进行建模。
为了创建语音语料库以用于后续的语音导入过程,录制了最终句子集(约 90 分钟的录音,16 位 - 44.1 KHz 采样率)。执行语音导入工具,将采样率更改为 16 KHz,并使用其默认配置创建了单元选择语音和基于 HMM 的语音。
维基百科似乎不是确保上下文感知对话应用程序足够覆盖的最佳资源。大多数问题实例出现在评论部分而非主文章中。此外,贪心算法中使用的简单“基于标点符号”的特征应通过额外的特征(如疑问词、否定词)进行丰富,以识别对应不同韵律实现的不同类型句子。选择过程可以通过使用更多特征(如话语位置、相对于操作符的位置等)来更加完善,
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



