图和三元组存储的综合指南
1. 组合查询
当在文档和语义世界之间采用联合方法时,可能会需要执行组合查询。组合查询是指同时对文档存储和三元组存储进行查询,以回答与数据库中所有信息相关的问题。
例如,文档来源查询就是一种组合查询,你可能希望返回特定集合中所有“类型”字段具有特定值,并且是由名为“大数据唱片公司”的组织添加的文档。
另外,存储的文档可能是经过语义提取和丰富的文本。如果文档发生变化,语义数据也会相应改变。此时,需要替换从文档中提取并存储在三元组存储中的信息集合,有两种方法可以实现:
- 使用命名图 :使用文档 ID 或其变体作为图的名称,并将所有提取的三元组存储在该图中,这样便于整体更新提取的元数据。此方法适用于所有三元组存储,但缺点是需要手动创建服务器端代码,分别对三元组存储和文档存储执行查询,以解决复杂的文档来源查询。
- 将三元组存储在提取它们的文档中 :如果文档结构支持嵌入不同命名空间的信息,如 MarkLogic Server,可以将三元组的 XML 表示存储在文档内的元素中。该方法的优点是将所有所需索引链接到同一文档 ID(MarkLogic Server 称为 URI)。MarkLogic Server 有内置的搜索引擎,支持全文、范围(小于、大于)查询以及语义(SPARQL)查询,可在一次索引命中(称为搜索索引解析)中回答整个查询。
AllegroGraph 图存储产品采用了不同的方法将文档 NoSQL 数据库与图存储连接起来。它提供了一个 API 来集成 MongoDB 文档存储,允许使用 SPARQL 查找与 SPARQL 查询匹配且与符
超级会员免费看
订阅专栏 解锁全文
128

被折叠的 条评论
为什么被折叠?



