开放数据表的语义集成:方法与评估
1. 数据处理基础
在处理开放数据表的语义集成时,会遇到一些特殊情况。例如,类节点有时并非是链接开放数据(LOD)概念,而是SKOS词汇表中定义的类别。SKOS词汇表有“更广泛”的概念,可解释为属性的定义域。在这种情况下,会使用 sb 链接将属性节点与类别节点相连,对象列则通过 sc 链接与属性节点相连。同时,边的 propName 标签指的是来自LOD的实际属性URI。
2. 挖掘属性关联
对于每对具有非空候选概念集的列,会使用形如 (dj, ?p1, dk) 和 (dk, ?p2, dj) 的查询元组,从LOD的两个方向寻找匹配属性。其中, ?p1 和 ?p2 表示链接列 cij 和 cik 之间数据值的 rdf:property , dj 和 dk 是来自相应列 cij 和 cik 的数据元素。对于属性 ?p1 , cij 为主题列, cik 为对象列。每个匹配属性在特征图中都有一个带有属性标签的独立节点,并通过 d 链接与各自的定义域类相连。
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



