翻译系统中的词汇选择与句法生成及有限状态设备翻译
在当今的翻译领域,有多种技术和方法被应用以实现更准确、高效的翻译。本文将介绍两种不同的翻译相关内容,一是转移系统中的词汇选择与句法生成,二是基于有限状态设备的统计机器翻译。
转移系统中的词汇选择与句法生成
在转移系统中,语言数据和计算方法是分离的。以LMT系统为例,它主要由四个部分组成:源语言分析、词汇转移、结构转移(转换)和词形生成。
转换在LMT系统中的位置
在进行词汇转移和转换之前,所有的分析阶段都已完成。解析器的输出是一个完整解释源语言句子的树结构,词汇转移和句法生成都会在这个树上操作。当转移词插入到树中后,转换会将其转换为目标树。转换规则用一种特殊的规则编写形式编写,并由用C语言编写的程序解释。目前,英德版本大约有160种转换,每种都有变体,它们按顺序应用,顺序大致从实质性的句法变化,到词汇替换和添加,再到表层结构变化和最后的完善。
词汇转移与转换的交互
词汇转移和结构转换组件在计算和组件层面是分离的,但设计为紧密协作。词汇转移为转换提供实际和潜在的转移以及指令。
例如,双语词典中动词“access”的转移如下:
- access ⇒(zu : greifen) (p auf acc) (即greifen + 可分前缀zu,指令:插入介词auf,并将介词的宾语设为宾格)
转换后的输出:
- They accessed the files. ⇒ Sie griffen auf die Akten zu.
- The files were accessed. ⇒ Auf die Akten wurd
超级会员免费看
订阅专栏 解锁全文
908

被折叠的 条评论
为什么被折叠?



