基于增量评估的SPARQL查询运行时优化及网络知识推理框架
1. 实验环境与数据集
在评估ROSIE的查询性能实验中,使用了特定的实验环境和多种数据集。
- 实验环境 :所有实验都在一台运行Debian 7.4的64位Linux内核机器上进行,配备两个Intel Xeon 2.0 GHz处理器和64 GB RAM。ROSIE用C++开发,使用GCC - 4.7.1以 - O3优化标志编译,采用PostgreSQL 9.4作为RDB后端,采用一元三元表模式,将系统参数shared buffers调整为2.5GB,让PostgreSQL实例使用更多共享内存缓冲区。
- 数据集 :
- LUBM :有4.845B个三元组,18个不同谓词。生成了包含20,480所大学的大型数据集,并对其进行子类和子属性推理。
- SNIB :有1.774B个三元组,48个不同谓词,生成了包含15,000个用户的数据集。
- DBpedia :有489M个三元组,60,223个不同谓词,使用英文子集。
2. 竞争对手系统
选择了四个公开可用且有竞争力的支持SPARQL的系统作为竞争对手:
|系统类型|系统名称|特点|
| ---- | ---- | ---- |
|专用系统|RDF - 3X|维护S、P和O的所有可能排列作为索引,使用B + - 树进行单TP的索引查找,有特定索引查询优化技术和运行时技术|
|专用系统|Trip
超级会员免费看
订阅专栏 解锁全文
1231

被折叠的 条评论
为什么被折叠?



