基于关系的图数据库聚合搜索方法
1. 引言
随着海量、复杂结构数据(如序列、树和图)的出现,数据库研究面临新挑战。图在许多应用领域中对于建模复杂结构和无模式数据变得越来越重要,例如生物信息学、化学、网络、社交网络、业务流程、电信等。网站、XML和RDF文档也可建模为图。
数据库领域长期关注图数据库查询。给定图数据库 $D = {g_1, g_2, …, g_n}$ 和查询图 $q$,任务是从数据库中检索与查询相似的图,即图匹配。标准图匹配方法分为精确匹配和近似匹配。图查询处理问题近年来得到了广泛研究,提出了许多方法,其核心在于快速检索可能是查询答案的图。
然而,目前很少有人关注在以下两种情况下以合理方式组装图来提供查询答案的问题:一是没有单个候选图与查询图同构;二是需要查询的额外答案。例如,查询教授的个人信息、所属大学、研究兴趣、研究历史等,这些信息可能分散在多个文档中。
本文提出一种基于关系的方法,利用关系数据库管理系统的有效性和可扩展性,支持图聚合搜索。目标是为基于图结构的数据集成提供灵活框架,用户无需指定片段之间的连接操作,片段的组合方式由特定算法确定。
2. 预备知识
- 术语定义
- 有向图 :概念上,任何数据都可用图表示。在有向图中,顶点和边分别表示实体和关系,与实体和关系相关的属性称为标签。形式上,有向图 $g$ 定义为 6 元组 $(V, E, L_v, L_e, F_v, F_e)$,其中 $V$ 是顶点集,$E \subseteq V \times V$ 是连接两个不同顶点的边集,$L
超级会员免费看
订阅专栏 解锁全文
950

被折叠的 条评论
为什么被折叠?



