法律领域的查询扩展:平台实现与应用
1. 方法选择与平台搭建
在众多查询扩展方法中,选择了三种方法进行实现,分别是 Voorhees、ATJ 和 HO。此外,平台还包含 Ancestor 方法,该方法通过树状结构中两个概念与共同父节点的距离来计算它们含义之间的距离。
为了测试这些查询扩展方法,搭建了一个通用平台。搭建过程如下:
1. 明确平台需求与动机 :确定平台的目标和用途。
2. 选择本体类型 :经过考虑,决定使用词库(Thesauri)。词库是结构化词汇表,能明确术语间的关系,可视为本体的子类。与本体相比,词库实现和维护更简单,且在所选的查询扩展方法中无明显劣势。
3. 确定本体表示语言 :最初考虑使用 OWL 语言表示本体,但因选择词库而改为 SKOS(Simple Knowledge Organization System)。SKOS 基于 RDF,是事实上的词库表示标准语言,能很好地满足词库中术语关系和属性的表示需求。
4. 设计平台架构 :平台架构分为三个主要模块,各模块功能如下:
- 查询扩展测试接口 :实现与用户交互的通用功能。
- 查询扩展引擎 :实现具体的查询扩展方法,由扩展术语查找器(ETF)和排序选择器组成。ETF 负责查找与查询主题最接近的术语,排序选择器对 ETF 返回的术语进行加权,并将最重要的术语添加到查询扩展输出集中。
- 本体管理
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



