基于语用学的机器翻译探索
1. 引言
在机器翻译领域,实现更高效、准确的翻译是一个持续追求的目标。这里提出的理论目标是,基于对作者/说话者(源语言)的世界观、作者对收件人(源语言)世界观的看法,以及作者的目标和计划进行建模,来明确“翻译等效性”的语用概念。通过这一机制分析作者/说话者的话语,得出其内容(预期含义)、形式和目的的表征。该表征随后作为生成目标语言话语的基础,而这又依赖于对作者/说话者(目标语言)的世界观、作者/说话者对收件人(目标语言)世界观的看法,以及可能修订的目标和计划的建模。
技术目标是拓展多语言机器翻译系统 ULTRA。运用偏好语义学、语义确定子句语法和对照语义学等方面的内容,并将该系统嵌入到由 Wilks 和 Ballim 开发的信念归因 ViewGen 模型中。工作将使用从《朗文当代英语词典》(LDOCE)自动提取的大规模语义结构作为本体和知识库。ULTRA 本身可被视为这些理论发展的一个可能平台。在 1992 年,ULTRA 是一个支持五种语言(英语、德语、中文、日语、西班牙语)的可逆翻译系统,每种语言约有 6000 个词汇,用 Prolog 编程,基于语言模块之间的中间表征。这里将重点关注语用、词汇和本体问题。
2. 近期的两种方法
当前研究中有两种重要方法,即形式语言学方法和统计方法,但与这里提出的模块化和中间语言方法相比,它们在机器翻译中的效果较差。
在形式语言学圈子中,常有人认为计算机解析问题已得到解决,应将注意力转向语言生成。然而,这一观点更像是英语语言学专家当前的关注点,而非针对通用机器翻译所需的大量文本处理。20 世纪最后几十年出现的新语法形式,虽声称能广泛涵盖语言现象,但并无证据表明它们能实现大
超级会员免费看
订阅专栏 解锁全文
6342

被折叠的 条评论
为什么被折叠?



