探索RDF数据:VOYAGE与LDO工具解析
1. VOYAGE:开放RDF数据集词汇使用集合
VOYAGE是一个来自各种开放RDF数据集的大型词汇使用集合,重点关注实体描述中术语共现的模式。通过对开放数据发布平台(ODPs)上注册的RDF数据集进行分析,VOYAGE提供了词汇、术语的使用情况及其共现模式提取信息,为语义网和开放数据社区带来了新的发现。
- 词汇聚类 :通过对词汇共现的分析,VOYAGE实现了词汇的聚类。例如,lexinfo和lemon这两个词汇在多个实体描述模式(EDPs)中共同出现,因此被聚类在一起。这种基于共现的聚类方法为传统基于主题的聚类提供了有益的补充。
- 数据分析优势 :与以往的分析不同,VOYAGE分别分析每个RDF数据集,能够更准确地刻画每个数据集中使用的词汇和EDP的多样性。而以往的分析大多将所有抓取的RDF文档作为一个整体进行处理,或者只是对RDF数据集进行相对粗粒度的分析。
- 数据来源拓展 :VOYAGE从ODPs收集RDF数据集,而以往的分析主要从网络上抓取RDF文档,并通过付费级域名(PLD)将其启发式地分组为RDF数据集。这种启发式构建的伪RDF数据集可能存在不准确的问题。VOYAGE进一步扩展了范围,还抓取了许多其他ODPs中注册的RDF数据集,并对LOD云内外的RDF数据集进行了比较分析,揭示了它们之间的巨大差异。
| 文件名称 | 包含信息 |
|---|---|
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



