基于信任的高效近似SPARQL查询:链接数据网络的优化方案
1. 引言
传统万维网实现了全球范围内文档的共享,文档通常以HTML、XHTML、DHTML等格式呈现,通过URL和HTTP(S)协议访问,形成了一个全球信息空间。然而,近年来,网络逐渐向数据网络演变,传统网络的数据表示牺牲了大量的结构和语义,文档之间的链接也不足以明确它们之间的关系。这促使了链接数据这一全球数据空间的出现。
链接数据利用现有的网络基础设施,将不同来源的数据相互连接起来。发布的数据是机器可读的,使用RDF格式进行表示。数据之间的连接通过RDF中的类型化语句来实现,清晰地定义了它们之间的关系,从而形成了一个数据网络。Berners - Lee提出的链接数据原则建议使用URI来命名事物,并以RDF格式描述这些事物,通过HTTP协议进行访问,使得所有发布的数据成为一个单一全球数据空间的一部分。
RDF是W3C基于去中心化的开放世界假设制定的用于建模和共享分布式知识的标准。任何知识都可以分解为包含主语、谓语和宾语的三元组,它是系统之间交换数据的最低共同点。三元组的主语和宾语可以都是标识实体的URI,也可以分别是URI和字符串值。谓语表示主语和宾语之间的关系,同样由URI表示。
SPARQL是W3C推荐的用于查询RDF数据的查询语言。一个SPARQL查询基本上由一组三元组模式组成,每个三元组模式的主语、宾语或谓语位置都可以有变量。解决方案是将这些变量绑定到RDF模型中根据查询结构相互关联的实体上。
目前,已经有多种查询链接数据网络的方法:
- 索引法 :像Sindice那样,通过跟随RDF链接爬取网络并构建发现数据的索引,然后针
基于信任的SPARQL近似查询优化
超级会员免费看
订阅专栏 解锁全文
5170

被折叠的 条评论
为什么被折叠?



