提升基于规则的 grapheme - to - phoneme 转换及文本复杂度评估研究
基于规则的 G2P 方法性能评估
在 G2P(grapheme - to - phoneme)转换领域,不同的方法展现出了各异的性能。对于评估指标,WLA(Word - Level Accuracy)和 GLA(Phone - Level Accuracy)的值越高越好,而 MNLD(Mean Normalized Levenshtein Distance)和 CRE(Conditional Relative Entropy)的值越低越好。以下是不同 G2P 方法的性能对比表格:
| 方法 | WLA ↑ | GLA ↑ | MNLD ↓ | CRE ↓ |
| — | — | — | — | — |
| 基于规则的 G2P 方法 | 67.47 % | 75.78 % | 0.13 | 2.19 |
| 基于规则 + 基于子词的方法 | 72.21 % | 78.49 % | 0.08 | 1.77 |
| 基于规则 + 基于记忆驱动的方法 | 79.18 % | 82.66 % | 0.04 | 1.34 |
| 基于规则 + 提出的 G2P 方法 | 89.36 % | 80.64 % | 0.04 | 1.06 |
从表格中可以看出,提出的方法在除 GLA 外的各种指标上都优于所有基线方法。这一性能得益于形态分割和音节划分模块的有效性。
提出的 G2P 方法在不同数据集上的性能
提出的 G2P 方法旨在通过形态分割和音节划分来处理复合词和屈折词。为此,在三个数据集上进行了性能分析,分别是包含简单词的数
超级会员免费看
订阅专栏 解锁全文
1230

被折叠的 条评论
为什么被折叠?



