阿拉伯语 - 英语和中文 - 英语的词对齐与翻译模型优化
1. 词对齐质量分析
词对齐是自然语言处理中机器翻译的重要环节,衡量词对齐质量的指标主要有精度(Precision)、召回率(Recall)和对齐错误率(AER)。以下是不同词对齐器在阿拉伯语 - 英语和中文 - 英语上的对齐质量结果:
|语言对|对齐器|精度|召回率|AER|
| ---- | ---- | ---- | ---- | ---- |
|阿拉伯语 - 英语|GIZA S2T|71.9|67.4|30.4|
|阿拉伯语 - 英语|GIZA T2S|64.5|72.7|31.6|
|阿拉伯语 - 英语|combined|68.0|76.5|28.0|
|阿拉伯语 - 英语|DWA – baseline|80.5|72.5|23.7|
|阿拉伯语 - 英语|DWA+Freq - class|83.7|69.6|24.0|
|中文 - 英语|GIZA S2T|51.7|34.9|58.3|
|中文 - 英语|GIZA T2S|66.5|56.9|38.7|
|中文 - 英语|combined|68.0|56.3|38.4|
|中文 - 英语|DWA - baseline|72.9|57.4|35.8|
|中文 - 英语|DWA+Freq - class|75.8|56.7|35.1|
从这些数据中可以看出,不同的对齐器在不同语言对上的表现存在差异。例如,在阿拉伯语 - 英语中,DWA + Freq - class 的精度较高;而在中文 - 英语中,GIZA T2S 的召回率相对较好。
阿拉伯语-英语词对齐与翻译优化
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



