链接开放数据与知识图谱技术解析
1. 链接开放数据(Linked Open Data)概述
链接开放数据(Linked Open Data,LOD)是对链接数据原则的扩展。链接数据不一定是开放的,2010 年,蒂姆·伯纳斯 - 李(Tim Berners - Lee)通过开放性原则扩展了链接数据的定义,从而提出了链接开放数据这一术语。其目的是鼓励机构(特别是政府)提供“优质”的链接数据。链接开放数据是指在开放许可下发布的数据,这种许可不会阻碍其免费再利用,例如知识共享署名许可协议(Creative Commons CC - BY)。
1.1 5 星评级方案
为了评估链接开放数据的质量,有一个 5 星评级方案:
1. 1 星 :在开放许可下,以某种格式将数据发布到网络上。
2. 2 星 :将数据以结构化格式提供(例如,使用 Excel 而非 PDF)。
3. 3 星 :以非专有开放格式提供数据(例如,使用 CSV 而非 Excel)。
4. 4 星 :使用统一资源标识符(URI)来表示事物,以便人们能够指向你的数据。
5. 5 星 :将你的数据与其他数据进行链接,以提供上下文信息。
1.2 发布链接开放数据的步骤
发布链接开放数据可遵循以下七个步骤:
1. 选择词汇表 :重用现有词汇表以增加数据集的价值,并对齐自己的词汇表以提高互操作性。
2
超级会员免费看
订阅专栏 解锁全文
578

被折叠的 条评论
为什么被折叠?



