链接开放数据与知识图谱:原理、应用与发展
1. 链接开放数据(Linked Open Data)
1.1 基础概念
链接开放数据(Linked Open Data,LOD)是对链接数据原则的扩展。链接数据并不一定是开放的,2010 年,蒂姆·伯纳斯 - 李(Tim Berners - Lee)通过开放性原则扩展了链接数据的定义,从而提出了链接开放数据这一术语。其核心目标是鼓励机构(尤其是政府)提供“优质”的链接数据。链接开放数据本质上意味着信息必须以开放许可证发布,例如知识共享许可协议(Creative Commons CC - BY)。
1.2 5 星评级方案
为了衡量链接开放数据的质量,有一个 5 星评级方案:
1. 1 星 :在开放许可证下,以某种格式在网络上提供数据。
2. 2 星 :以结构化数据形式提供(例如,使用 Excel 而非 PDF)。
3. 3 星 :以非专有开放格式提供(例如,使用 CSV 而非 Excel)。
4. 4 星 :使用统一资源标识符(URI)来表示事物,以便人们能够指向你的数据。
5. 5 星 :将你的数据与其他数据进行链接,以提供上下文信息。
1.3 发布流程
发布链接开放数据可以遵循以下七个步骤:
1. 选择词汇表 :重用现有词汇表以增加数据集的价值,并对齐自己的词汇表以提高互操作性。
超级会员免费看
订阅专栏 解锁全文
626

被折叠的 条评论
为什么被折叠?



