60、奥德赛:优化联邦SPARQL查询的有效途径

奥德赛:优化联邦SPARQL查询的有效途径

1. 基数估计与连接优化

在处理查询时,对于像Listing 1.3中的查询,属性 dbo:director 连接了多对表示电影和演员的特征集(CS)。此时需要计算 Σf1∧f2 count((Ci, Cj, dbo:director)) ,其中 f1 ({dbo:runtime, dbo:director, dbo:budget} ⊆Ci) f2 ({dbo:birthDate, dbo:activeYearsStartYear, foaf:name} ⊆Cj) 。在DBpedia 3.5.1中,有1,509个特征对(CP)通过 dbo:director 属性连接两个CS中的实体。

若查询不涉及 DISTINCT 修饰符,结果基数估计会考虑CS中属性的出现次数,计算公式如下:

estimatedCardinality((Pk, Pl, p)) =
    ∑ Pk⊆Ci∧Pl⊆Cj [
        count((Ci, Cj, p))
        * ∏ pk∈Pk−{p} [ occurrences(pk, Ci) / count(Ci) ]
        * ∏ pl∈Pl [ occurrences(pl, Cj) / count(Cj) ]
    ]

在对星型子查

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值