知识图谱托管范式全解析
1. 关系数据库用于知识图谱托管
关系数据库为从关系数据库构建知识图谱提供了相对廉价的方式,并且能在工业标准软件环境中实现平滑集成。不过,它也存在一些明显的缺点:
- 查询重写和展开问题 :查询重写和展开过程中可能出现诸多问题,映射需要额外关注。
- 模式查询挑战 :由于底层的关系模型,查询模式具有挑战性。
- 查询和推理能力有限 :通常仅提供有限的查询和推理能力。
此外,在数据模型、异构性和速度方面,关系数据库也存在不足。关系数据库的模式是刚性且严格解耦的,而知识图谱通常采用灵活的模式,这使得关系数据库不太适合表示知识图谱。而且,任何导致新TBox知识的推理可能需要重新编译模式,这是一项代价高昂的操作。同时,表示继承等关系也很棘手,在不涉及应用逻辑或外部定义规则的情况下,即使为RDFS实现蕴含规则也并非易事。
2. 文档模型
文档模型将数据存储为嵌套的键值对,在许多实现中,这些数据被组织成文档,类似于关系数据库中的元组。随着大数据和流数据的兴起,文档存储变得流行起来,因为它们没有刚性模式,并且可以轻松扩展。在许多实现中,文档被组织成所谓的集合,集合类似于关系数据库中的表,但不强制执行模式,因此集合中存储的每个文档可以具有不同的结构和元数据。
文档模型可以通过两种方式用于托管知识图谱:
- 嵌套对象方式 :这是存储文档的原生方式,一个实例的所有信息都存储在一个文档中。这种方式便于访问单个文档,但更新存在问题,因为出现在多个文
超级会员免费看
订阅专栏 解锁全文
981

被折叠的 条评论
为什么被折叠?



