探寻文学翻译中源语言痕迹
在当今全球化的时代,文学翻译在文化交流中扮演着至关重要的角色。然而,如何准确地区分英语翻译文本和原创英语文本,以及猜测翻译文本的源语言,一直是研究的热点。本文将深入探讨相关研究,介绍研究背景、方法和实验结果。
1. 研究背景
在翻译研究领域,区分英语翻译文本和原创英语文本,以及猜测翻译文本的源语言是一个重要课题。过去的研究已经取得了一定的成果,例如Lynch和Vogel的研究专注于英语文学文本语料库,包含了从法语、德语和俄语翻译成英语的文本以及原创英语文本,达到了约80%的准确率。该研究的特征集除了词元级别的独特特征外,还包括“文档级别”的统计信息。相比之下,van Halteren在EUROPARL语料库的类似任务中,仅使用词元级别的特征就达到了86%的准确率。
翻译过程中会产生各种效应,这些效应可能导致翻译文本与原创文本存在差异。翻译研究提出了翻译普遍性的概念,如显化(将源语言中隐含表达的内容在目标语言中更明确地表达出来)和简化(简化内容,例如采用较简单的句子结构),但这一概念仍存在争议。而干扰现象则更具语言对的特异性,目标语言中的不规则现象通常可以追溯到源语言的特性。
文本分类方法在识别可能源于源语言的翻译文本特定项目方面的应用才刚刚起步。Baroni和Bernardini利用机器学习技术,基于大型意大利报纸语料库,通过结合词元、混合一元词、二元词和词性三元词等特征,实现了约86%的分类准确率。van Halteren在EUROPARL语料库的研究中,考虑了特定语言文本中单个序列的信号强度以及使用程度的高低,在猜测演讲的源语言方面达到了87.2 - 96.7%的准确率。
此外,还有许多研究探索了翻译方向和翻译