基于本体合取查询的语义网搜索技术解析
系统概述
语义网搜索系统旨在利用语义信息提升搜索的准确性和效率。其整体架构主要由接口、查询评估器和推理引擎组成,其中查询评估器基于标准的网络搜索引擎实现。
标准网页及其对象通过基于本体的注释页面进行语义丰富。语义注释可以来自用户自定义(如 Web 2.0 中的用户注释),也可以通过自动学习网页和对象的信息,或者从现有的语义网本体知识库中提取。
例如,一个网页 i1
包含关于博士生 Mary( i2
)以及她的两篇论文(会议论文 i3
和期刊论文 i4
)的信息。这些网页和对象的语义注释可以形式化为以下公理集合:
Ai1 = {contains(i1, i2), contains(i1, i3), contains(i1, i4)}
Ai2 = {PhDStudent(i2), name(i2, “mary”), isAuthorOf(i2, i3), isAuthorOf(i2, i4)}
Ai3 = {ConferencePaper(i3), title(i3, “Semantic Web search”)}
Ai4 = {JournalPaper(i4), hasAuthor(i4, i2), title(i4, “Semantic Web search engines”), yearOfPublication(i4, 2008), keyword(i4, “RDF”)}
推理引擎在离线本体编译步