不确定数据排名查询的未来拓展方向
1. 概率链接模型与路径查询基础
在处理不确定数据时,我们会遇到这样的情况:元组 (tB \in B) 可能是多个对象 ({tA1, \cdots, tAd}) 的实例,其中 (tAi) 是 (A) 中的元组,且存在链接关系 ((tAi, tB) \in L)((1 \leq i \leq d))。这里有一个互斥规则 (RtB = (tAi, tB) \oplus \cdots \oplus (tAd, tB)),它规定在一个可能的世界中,(tB) 只能属于一个对象。我们也可以把每个元组 (tB \in B) 看作一个不确定对象,如果存在链接 ((tA, tB) \in L),那么元组 (tA \in A) 就是 (tB) 的一个实例。
为了描述概率链接模型中对象之间的依赖关系,我们开发了概率互斥图(PME - graph),它是马尔可夫随机场的一种特殊形式。回答概率链接上的排名查询与独立不确定对象上的查询有很大不同,我们提出了高效的查询评估方法,并且实验结果验证了这些方法的高效性和可扩展性。
在不确定道路网络方面,它是一个简单图,每条边的权重是一个包含一组实例的不确定对象,所以不确定网络中任何路径的权重也是不确定对象。我们提出了三种类型的概率路径查询:
- 带权重阈值 (w) 和概率阈值 (p) 的概率路径查询 :找到两个端点之间权重至多为 (l) 且概率至少为 (p) 的路径。
- 权重阈值前 (k) 路径查询 :给定路径 (P) 和权重约束 (l),(l) - 权重概率是路径 (P) 的权重至多为 (l) 的概率。该查询返回两个端点之间 (l)