基于本体的语义相关性确定方法
1. 引言
语义网推动了显式背景知识(元数据)的使用,以管理各种资源。元数据依据领域本体具有明确的含义,该本体为论述领域提供了共享的概念化描述。资源通过元数据模式和领域本体中的值进行索引,这种索引方式被称为注释。基于本体的信息检索是将注释或用户生成的查询与基于本体的知识库进行相关性匹配的操作。通常,利用基于本体的知识库的系统是语义门户,它们提供对注释的搜索功能。处理大量答案集需要有效的方法来根据与查询或注释的相关性对搜索结果进行排名。确定这种相关性的方法是有效进行基于本体的信息检索的先决条件。
目前,本体信息检索的研究大多集中在使用智能用户界面进行精确逻辑查询,部分研究进一步发展以支持模糊逻辑。在确定结构相似性方面,已有如 SimRank、SimFusion、AKTiveRank 和 Swoogle 等方法。但这些方法存在一定局限性,例如 SimRank 仅关注图理论模型而非特征向量;SimFusion 未将特征与本体绑定;Swoogle 专注于将类和术语与本体匹配,而不考虑注释之间的相互相关性;AKTiveRank 以语义相似性和术语对齐作为排名原则。
本文提出了一种计算注释之间相互相关性的方法。与上述方法不同,该方法专注于基于底层领域本体的注释相关性,并通过考虑领域本体和 RDF(S) 语言的基本特征扩展了 tf - idf 方法。此方法可用于知识推荐、信息检索和聚类等多种应用。
2. 语义网上的知识表示
2.1 注释的表示
语义网包含关于资源的元数据,即注释。注释使用 RDF(S) 语言表达,每个关于资源的陈述都以注释三元组的形式给出。一组注释三元组描述一个资源 x。
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



