跨语言信息检索与词汇资源处理研究
在当今信息爆炸的时代,跨语言信息检索和词汇资源处理变得越来越重要。跨语言信息检索能够帮助用户跨越语言障碍获取所需信息,而词汇资源处理则是机器翻译和自然语言处理的基础。下面将详细介绍相关的技术和项目。
1. 跨语言信息检索技术
1.1 基于词典的查询翻译技术
- DQT - SW 和 DQT - EW :DQT - SW 是选择单个候选翻译,而 DQT - EW 则使用所有可能的翻译。实验结果显示,DQT - SW 并不比 DQT - EW 差,在某些情况下甚至表现更好。
- DQT - EP 和 DQT - EPS :DQT - EP 是保留双语术语列表中每个精确的短语匹配,DQT - EPS 是其词干化的类似形式,保留每个精确的词干匹配。
1.2 基于机器翻译的查询翻译(MQT)
机器翻译系统旨在将文档从一种语言翻译成另一种语言。在实验中,使用 Logos 机器翻译系统将英语查询翻译成德语用于 SDA/NZZ 集合,将德语查询翻译成英语用于 AP 集合。该系统为每个输入生成一个“最佳猜测”翻译,与 DQT - SW 技术类似。
1.3 基于机器翻译的文档翻译(MDT)
选择英语作为查询语言,将 SDA/NZZ 集合中的每个文档翻译成英语作为预处理步骤。然后对翻译后的文档集合进行索引,并使用英语查询进行检索实验。这将跨语言检索简化为单语言检索的情况。
1.4 外语查询(FLQ)
单语言信息检索系
超级会员免费看
订阅专栏 解锁全文
910

被折叠的 条评论
为什么被折叠?



