文化遗产元数据聚合中 Schema.org 的评估与应用
1. 动机与背景
Schema.org 旨在鼓励互联网上结构化数据的发布和使用,其主要应用于网页,例如描述网页是关于烹饪食谱、电影等。目前已有超过 1000 万个网站使用 Schema.org,谷歌、微软等公司也基于其结构化数据提供服务。
在文化遗产(CH)领域,Schema.org 能帮助 CH 机构减少数据转换的工作量,实现资源在互联网搜索引擎和 CH 特定元数据聚合平台(如 Europeana)上的发现。
CH 元数据聚合通常采用约定的数据模型,以可持续的方式处理组织和国家间的数据异质性。这些数据模型需满足两个主要要求:
- 保留源数据提供者的原始数据语义。
- 支持聚合器提供的服务的信息需求。
在 Europeana 聚合过程中,Europeana 数据模型(EDM)是核心。EDM 自 2010 年定义以来不断改进,支持 Europeana 的核心流程和数据共享。它不限制元数据交换的 Web 技术,可序列化多种 XML 和 RDF 语法,为聚合网络的技术创新提供了灵活性。其他类似聚合组织(如美国数字公共图书馆 DPLA)也采用基于 EDM 的模型。
为评估 Schema.org 元数据在 CH 元数据聚合中的适用性,我们收集和分析了 CH 机构的 Schema.org 元数据,并根据 Europeana 的特定要求进行评估。研究前提是:若 Schema.org 元数据能表达 EDM 的信息需求和数据质量要求,则可用于许多基于元数据聚合的 CH 服务;反之,在其他 CH 场景中可能也会遇到相同障碍。
超级会员免费看
订阅专栏 解锁全文
1838

被折叠的 条评论
为什么被折叠?



