FedShop:用于联邦查询的基准测试方案
1. 引言
在数据查询和处理领域,联邦查询引擎的性能评估至关重要。现有的一些基准测试,如 FedBench、LargeRdfBench 等,在评估联邦查询引擎的扩展性等方面存在一定的局限性。而 FedShop 作为一种新的基准测试方案,旨在解决这些问题,为联邦查询引擎的评估提供更有效的支持。
2. 相关工作回顾
2.1 现有基准测试的特点与问题
- FedBench :主要用于测试和分析处理 SPARQL 端点中 RDF 数据的 SPARQL 联邦引擎的性能。其数据集包含来自不同领域的 10 个数据集和 14 个真实查询。为了增加数据集和查询数量,它还提出了 FedBench/SP2Bench 设置,但基于类的聚类方法存在局限性,生成的分区与现实世界数据集的特征不符。
- LargeRdfBench :扩展了 FedBench 的数据集和工作量,分别达到 13 个数据集和 40 个查询。然而,它和 FedBench、FedBench/SP2Bench 一样,无法评估联邦查询引擎在联邦成员数量增加时的行为。
- QFed :提出增加更多的联邦查询,但这并不能解决联邦成员数量增加时的可扩展性问题。
2.2 数据集分区方法及问题
为了扩展联邦规模,Lusail、DARQ、LHD、LILAC 等提出将数据集划分为多个数据集的方法,包括水平、垂直和混合分区等。但像 BSBM、LUBM、SP2Bench
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



