语义网数据推理与流推理系统研究
1. 链接数据引用与推理问题
在处理链接开放数据(LOD)时,数据引用和推理过程存在诸多挑战。对LODL2数据的分析显示,平均而言,谓词引用自超过18个来源(中位数为9),类引用自超过11个来源(中位数为6)。但当Pellet推理未失败时,这些数字显著降低,谓词来自5个来源(中位数为2),类来自约7个来源(中位数为2),这表明过度链接到多个来源会增加出现不一致的概率。
2. OWL导入研究
2.1 数据收集
owl:imports 指令是将文档链接到外部本体的标准机制。在整个LODL数据集中,使用该指令的文档不到0.2%(939个文档),在WDC数据集中仅有121个文档使用。对这些文档进行本地推理并过滤掉推理失败的文档后,得到LODL3(554个文档,83个来源)和WDC3(121个文档,16个不同来源)两个子集。
WDC3中的文档仅导入 goodrelations 本体,该本体可访问且无其他链接;而LODL3中的文档从62个不同域名导入221个不同本体,其中76.9%的导入本体可访问,仅有52个文档导入了具有嵌套 owl:imports 语句的本体,且发现传递性 owl:imports 链的最大长度为4。相关文档和导入本体的详细信息如下表所示:
| 数据集 | # Triples(最大值) | # Triples(平均值) | # Triples(中位数) | # Triples(最小值) | # Imported ontologies(最大值) | # Imported
超级会员免费看
订阅专栏 解锁全文
20万+

被折叠的 条评论
为什么被折叠?



