跨语言音素序列的发音提取技术探索
1. 引言
在语音处理和翻译领域,从音素序列中提取准确的发音信息是一项关键任务。特别是对于资源相对匮乏的语言,如何高效且准确地构建发音字典是一个重要的研究方向。本文将介绍一种基于跨语言词 - 音素对齐的发音提取算法,并通过实验验证其有效性。
2. 词分割
词分割问题旨在将音素序列分割成单词单元。跨语言词 - 音素对齐是发音提取算法的基础。我们使用新的对齐模型 Model 3P 来处理这一问题。该模型扩展了 IBM Model 3 的生成过程,增加了单词长度步骤和词汇翻译概率的额外依赖。
在 BTEC 语料库上,使用 Model 3P 对英语单词和正确的西班牙语音素序列进行对齐,获得了 76.5% 的 F - 分数(90.0% 的准确率),相比最先进的单语言词分割方法,F - 分数绝对提高了 42%(准确率提高了 18.2%)。
3. 单词发音提取
3.1 形式框架
设 $V_{src}$ 为源语言的词汇表,$PhonemeSet_{trgt}$ 为目标语言的音素集。我们的数据来源是一个集合 $DB \subset V_{src}^+ \times PhonemeSet_{trgt}^+$,其中包含源语言的书面句子及其目标语言的口语翻译。
使用 Model 3P 为 $DB$ 中的每个句子 - 音素序列对找到词 - 音素对齐。对齐 $A_{s,t}$ 是源语言句子 $s \in V_{src}^+$ 中的单词与目标语言音素序列 $t \in PhonemeSet_{trgt}^+$ 中分割成单词单元的音素之间的映射。我们将 $A_{s,t
超级会员免费看
订阅专栏 解锁全文
1760

被折叠的 条评论
为什么被折叠?



