双语搜索系统和辅导系统:通过查询扩展提升信息检索性能
1. 引言
在当今数字化时代,信息资源通过互联网广泛分布,搜索引擎已成为信息检索的重要工具。用户需要在多种语言和形式中找到并检索相关信息,而查询扩展技术在提高跨语言信息检索(CLIR)的效果方面起到了至关重要的作用。此外,查询扩展技术还可以应用于其他智能系统,如辅导系统,以增强其功能。
查询扩展是指在用户提交的查询基础上,搜索引擎通过添加同义词和相关词来扩大查询范围,从而提高检索效果。查询扩展技术可以分为手动、交互式和自动三类。手动查询扩展由用户自行修改查询,无需系统辅助;交互式查询扩展让用户在扩展过程中与系统互动;自动查询扩展则是在没有用户干预的情况下,系统自动修改查询。
本文将详细介绍一种基于词典的自动查询扩展系统,该系统能够显著提高英语和泰语的跨语言信息检索性能,并探讨其在智能辅导系统中的应用潜力。
2. 提出的工作
2.1 查询扩展系统概述
我们的查询扩展系统由两个主要功能组成:搜索功能和浏览功能。搜索功能包括四个组件:操作符规范、查询扩展、查询翻译和相似度测量。系统使用了两个现有的资源:LEXiTRON(泰英双语词典)和 SANSARN(双语搜索引擎)。以下是每个组件的具体描述:
2.1.1 操作符规范
操作符规范允许用户通过布尔运算符(AND、OR、NOT)逻辑关联多个概念,以定义所需的信息。例如,用户可以提交查询:“哺乳动物 AND 两足动物 NOT 人类”。
2.1.2 查询扩展
查询扩展组件使用基于词典的技术,通过添加同义词和相关词来扩展查询。我们使用 L
超级会员免费看
订阅专栏 解锁全文
39

被折叠的 条评论
为什么被折叠?



