17、S2X:基于GraphX的RDF图并行查询技术解析

S2X:基于GraphX的RDF图并行查询技术解析

1. RDF图在GraphX属性图数据模型中的表示

RDF(Resource Description Framework)具有简单性和灵活性,能对任意资源的知识进行建模,资源由全局标识符(IRIs)表示。例如,DBpedia中达芬奇的IRI是 http://dbpedia.org/resource/Leonardo da Vinci

要将RDF图$G = {t_1, \ldots, t_n}$表示为GraphX的属性图数据模型,需定义以下集合:
- $S(G) = {s | \exists p, o : t = (s, p, o) \in G}$:图$G$中所有主体的集合。
- $P(G)$:所有谓词的集合。
- $O(G)$:所有对象的集合。

对应的属性图$PG(P) = (V, E, P)$,其中:
- $V = S(G) \cup O(G)$:顶点集合。
- $E = {(s, o) | \exists t = (s, p, o) \in G}$:边集合。
- $P_V.label : V \to S(G) \cup O(G)$和$P_E.label : E \to P(G)$:顶点和边的标签函数。

由于GraphX为提高效率要求顶点标识符为64位整数,因此使用Spark提供的 zipWithUniqueID 函数为图$G$中的所有主体和对象派生唯一整数ID,并将原始术语保留在标签属性中。每个三元组$t = (s, p, o) \in G$由两个顶点$v_s, v_o \in V$

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值