53、欧洲文化遗产元数据聚合的创新架构与方法

欧洲文化遗产元数据聚合的创新架构与方法

1. 欧洲文化遗产聚合项目现状

典型的欧洲文化遗产聚合项目通常使用元数据映射系统和 OAI - PMH 导出系统,将原生元数据模式映射到欧洲语义元素(ESE)模式,近期也映射到欧洲数据模型(EDM),然后通过 OAI - PMH 进行数据采集。不过,这种方法虽然经过验证且较为可靠,但由于其架构简单,缺乏此类项目中可提供的增值服务。

2. CARARE 架构与 MoRe 系统
  • CARARE 架构 :引入了一个中央存储库,所有元数据在映射到 EDM 并提供给欧洲数字图书馆之前,先存储在该中央存储库并进行丰富处理。将所有元数据对象集中到一个系统中,为内容提供者创造了增值服务,例如可以使用语义关系丰富对象、测量元数据质量等。同时,中央系统不仅保存转换后的元数据,还保存原生元数据,便于提供者元数据的长期保存。
  • MoRe 系统 :是 CARARE 存储库,扩展了 MOPSEUS 的功能,完全符合 OAIS 标准。它允许通过传统的基于 OAI - PMH 的方法以及包含复杂数据流和信息的提交包来摄取元数据,以尽可能多地保存信息并实现增值服务。存储库中的所有信息以 OAIS 模型定义的三种包形式存在:提交包、存档包和传播包。各种服务利用这些信息创建自己的包,并通过创建新版本将其摄取到存储库中。
3. MoRe 系统的服务功能
服务功能 具体描述
地理信息标准化 帮助用户快速定位对象中的地理和时间信息,查看这些信息将如何被欧洲服务解析,并在必要时进行标准化处理。
语义丰富 这是 MoRe 的主要功能,利用从 EDM 派生的语义关系丰富对象。用户可以快速定位相关对象并添加它们之间的语义关系。在丰富过程中,会创建丰富的元数据数据流,以保存 MoRe 内的所有信息。
元数据完整性监控 通过进行超越传统必填字段检查的检查,持续监控和报告元数据的完整性,确保提供给欧洲数字图书馆的元数据质量。
4. CARARE 模式的特点与地理数据处理
  • 模式基础 :CARARE 模式建立在考古/建筑遗产社区长期的模式开发历史之上,受到早期 CIDOC 考古遗址核心数据标准、CIDOC CRM、LIDO 以及欧洲数据模型等工作的影响。它以纪念碑和建筑物及其数字表示的信息资源为核心。
  • 地理数据重要性 :地点(即纪念碑或建筑物的位置)是查询考古和建筑遗产的常见起点,对历史环境的研究和保护都很重要。纪念碑清单通常包含命名位置和地理空间坐标的详细信息,以便在现实世界中定位遗址。地理空间数据的可用性使得遗产数据集能够纳入环境规划的地理门户中,并且可以将纪念碑和建筑物与其他受保护资源的详细信息一起查看。
  • 地理数据处理 :CARARE 元数据模式提供了丰富的空间数据元素,包括命名地点(如巨石阵或狄俄尼索斯神庙)和地理空间坐标(包括点、边界框、高度等)。然而,CARARE 内容提供者使用的原生系统存在地理数据方面的问题,即使用国家地图参考系统。将数据集成到欧洲这样的国际服务中,需要将地理数据从国家坐标系(如英国使用的 OS 国家网格系统)转换为世界大地测量系统(如 WGS84)。CARARE 将为其内容提供者提供服务,在数据摄取到 CARARE 存储库后、提供给欧洲之前,将其坐标转换为 WGS84。
5. CARARE 模式与欧洲数据模型的映射
  • 映射规则
    • CARARE 元素直接映射到 EDM 类和 ESE 元素,或特定的 EDM 路径。EDM 路径定义为类/子类/ESE 元素 -> EDM 属性 -> 类/子类/ESE 元素的序列。
    • 认为纪念碑是 EDM 类“物理事物”的实例,其特定特征(如性质、位置、相关事件等)归属于该类。
    • 关于遗产资产或数字资源的信息是“欧洲对象”类的实例,这些信息可以是文本元数据(如标题等)、缩略图和其他代表纪念碑的数字对象。
  • 映射影响 :欧洲最近发布了 EDM 的 XML 模式,为其在 2011 年秋季的欧洲界面实现提供了框架。但该实现排除了“物理事物”和“活动”类,这对 CARARE 有影响。将遗产资产识别信息和数字资源概念性地映射到“欧洲对象”类,为向欧洲提供数据提供了框架,而在 CARARE MoRe 存储库中维护完整的元数据(包括无法映射到 EDM 的活动和其他元素的数据)将有助于未来的发展。
graph LR
    A[原生元数据] --> B[CARARE 中央存储库]
    B --> C[元数据丰富处理]
    C --> D[映射到 EDM]
    D --> E[提供给欧洲数字图书馆]
    F[地理数据转换服务] --> B
6. 希腊“本地清单”元数据采集与标准评估
  • 希腊“本地清单”现状 :国家清单在文化遗产管理中的作用早已得到认可,但希腊众多“本地清单”记录使用了不同的模式和描述方法,且大多缺乏官方元数据标准。为了研究这些记录中的元数据元素,向 43 个负责希腊建筑文化遗产的公共服务机构收集了 31 种不同的清单记录表单,代表了 31 种不同的模式和“清单系统”,这些表单用于记录不可移动的纪念碑,特别是历史建筑。
  • 构建转换(枢轴)模式 :将上述模式中的所有元素根据语义意义聚类为 15 个信息类别,形成一个由 15 个类别和 135 个元素组成的新元素集。为了确定哪个官方且广泛使用的元数据标准能在语义上覆盖这个新模式,并展示这些标准的不足,采用了交叉映射实践并创建了转换机制。新的转换(枢轴)模式作为源模式,与 MIDAS Heritage、CDWA、CDWA Lite、VRA Core 4.0 和 CDI 等目标模式进行映射。
  • 评估官方元数据标准
    • CDI(1992) :定义了记录历史建筑、考古遗址和纪念碑的核心信息,旨在将单个建筑物和遗址分类为 9 个信息组(部分),包含 45 个数据字段,部分为必填字段。它便于编译器对建筑物的详细信息进行交叉引用。
    • MIDAS Heritage(1998) :是用于英国和爱尔兰历史环境信息的数据标准,由 9 个主题、16 个信息组和 138 个信息单元组成。“纪念碑”信息组涵盖了不同类型和年代的建筑遗产。
    • CDWA :由盖蒂研究所和艺术信息任务组在 20 世纪 90 年代后期开发,是为描述独特的艺术作品、建筑和物质文化专门设计的数据结构标准,包含 532 个类别和子类别以及相关指南。
    • CCO :是为处理独特的艺术、建筑和物质文化物品而设计的数据内容标准,也是用于表达和交换这些作品元数据记录的技术格式或数据交换标准。
    • CDWA Lite(2006) :是 CDWA 的简化版本,对应于 CCO。其目的是基于 CDWA 和 CCO 中的数据元素和指南,描述艺术作品和物质文化核心记录的格式。它提供了符合 CCO 的 XML 格式,XML 模式共有 22 个顶级元素。

通过这些创新的架构和方法,有望更好地实现欧洲建筑和考古资产及其相关数字资源的元数据聚合,提高元数据质量和互操作性,为文化遗产的研究、保护和传播提供有力支持。

欧洲文化遗产元数据聚合的创新架构与方法

7. 转换(枢轴)模式与目标模式的映射实践

在将转换(枢轴)模式与各个目标模式进行映射时,采用了绝对交叉映射的方法。这是因为源模式(转换模式)结构比许多目标模式更丰富,若不进行精确映射,在从丰富结构转换到简单结构的过程中,目标模式可能会丢失或扭曲其含义。而且基于实际数据转换构建的交叉映射与基于元数据规范构建的可能有很大不同。

目标模式 映射情况
MIDAS Heritage 尝试将转换模式中的元素与 MIDAS Heritage 的 9 个主题、16 个信息组和 138 个信息单元进行对应,找出语义上相近或等价的元素进行映射。
CDWA 由于 CDWA 包含 532 个类别和子类别,映射过程较为复杂。需要仔细分析转换模式元素与 CDWA 中各元素的语义关系,将相关元素进行关联。
CDWA Lite 对应于 CCO 的 CDWA Lite 有 22 个顶级元素。在映射时,重点关注转换模式元素与这些顶级元素的匹配情况,以实现数据的合理转换。
VRA Core 4.0 对转换模式元素与 VRA Core 4.0 的相关元素进行比对,确定可映射的部分,同时也发现了一些无法直接映射的元素,反映出该标准在描述不可移动遗产方面的局限性。
CDI 将转换模式元素与 CDI 的 9 个信息组和 45 个数据字段进行映射,通过这种方式可以评估 CDI 在涵盖不可移动纪念碑元数据方面的能力。
8. 各标准在描述不可移动遗产方面的不足分析

通过映射实践,可以清晰地看到各标准在描述不可移动遗产时存在的一些不足:
- CDI :虽然定义了核心信息,但在某些细节方面可能不够全面。例如,对于一些独特的建筑特征或复杂的历史背景信息,可能无法很好地涵盖。
- MIDAS Heritage :主要是为英国和爱尔兰的历史环境信息设计,在国际通用性方面可能存在一定局限。对于其他国家不同类型的不可移动遗产,可能无法准确描述其特定的属性。
- CDWA :虽然元素丰富,但过于庞大和复杂,在实际应用中可能会导致操作困难。而且对于一些非艺术领域的不可移动遗产特征,可能缺乏针对性的描述元素。
- CDWA Lite :作为简化版本,虽然提供了核心记录格式,但由于元素数量有限,可能无法完整地描述不可移动遗产的所有信息。
- VRA Core 4.0 :在描述不可移动遗产的地理信息、历史背景等方面存在不足,无法满足全面记录不可移动纪念碑元数据的需求。

9. 创新架构与方法的优势总结
  • 增值服务提供 :CARARE 架构的中央存储库和 MoRe 系统为内容提供者提供了增值服务,如语义丰富、元数据完整性监控等,提高了元数据的质量和可用性。
  • 地理数据处理能力 :能够处理地理数据从国家坐标系到世界大地测量系统的转换,解决了不同坐标系之间的数据集成问题,使得遗产数据能够更好地在国际服务中共享。
  • 元数据聚合与互操作性 :通过构建转换(枢轴)模式,并将其与多种官方标准进行映射,有助于减少元数据的语法和语义异质性,提高了不同系统之间的互操作性。
  • 长期数据保存 :MoRe 系统符合 OAIS 标准,能够对元数据进行长期保存,确保了文化遗产数据的可持续性。
graph LR
    A[转换(枢轴)模式] --> B[MIDAS Heritage]
    A --> C[CDWA]
    A --> D[CDWA Lite]
    A --> E[VRA Core 4.0]
    A --> F[CDI]
    B --> G[评估映射效果]
    C --> G
    D --> G
    E --> G
    F --> G
    G --> H[发现标准不足]
10. 未来发展展望
  • 标准完善 :基于本次研究发现的各标准在描述不可移动遗产方面的不足,未来可以对这些标准进行进一步的完善和扩展。例如,增加针对不可移动遗产特定属性的描述元素,提高标准的全面性和针对性。
  • 数据整合与共享 :进一步加强不同文化遗产数据库之间的数据整合与共享,通过建立统一的数据接口和规范,实现元数据的无缝交换和集成。
  • 技术创新应用 :随着技术的不断发展,可以探索将人工智能、大数据等新技术应用于文化遗产元数据的处理和分析中。例如,利用人工智能进行元数据的自动分类和标注,提高数据处理的效率和准确性。
  • 国际合作与交流 :加强国际间的合作与交流,共同制定和推广适用于全球的文化遗产元数据标准,促进文化遗产的全球共享和保护。

通过不断地改进和创新,欧洲文化遗产元数据聚合的架构和方法将能够更好地适应文化遗产保护和研究的需求,为人类文化遗产的传承和发展做出更大的贡献。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值