数字对象的持久存储与证据保障
1. 持久位串与目录
从存储库馆藏构建目录记录这一方法,尚未得到应有的关注。理想情况下,存储库应仅接收符合其完整性标准的入藏品,包括对随附元数据的要求。这就要求每个信息生产者为其提交的存储库内容提供符合要求的元数据。这样,以这种方式准备的入藏品的目录条目就可以(而且应该)作为对象摄取过程的一部分自动构建。
这种方法具有一些有价值的优势,首先是目录与馆藏的自动一致性。它还使目录重新排列变得容易。当机构决定通过改进目录来提高信息发现的便利性、搜索性能或内容可访问性时,它可以选择任何能实现改进的目录数据库表更改,并通过为其当前的每个馆藏运行数字对象导入服务来构建替换目录。这一过程不会干扰正在进行的存储库服务。
1.1 馆藏摄取与共享
信息摄取是存储库正确接收信息的过程,会仔细检查所接收的信息是否符合公布的规则。元数据收割是从已接收且可能已被摄取到其他存储库(而非目标存储库)的信息中提取元数据的过程。理想情况下,要提取的元数据应符合某些元数据标准的要求,并且信息源对象应符合已知的标准化格式。如果这些条件不满足,提取的元数据几乎肯定是不完美的,可能需要人工帮助。即使满足这些条件,也不一定足以实现令人满意的自动元数据生成。
元数据共享、存储库之间的馆藏转移以及存储库信息摄取的技术密切相关。开放存档倡议元数据收割协议(OAI - PMH)是一种轻量级协议,可实现从可互操作的存储库访问网络可访问材料,用于元数据共享、发布和存档。它通过一个定义元数据共享格式的社区过程,帮助信息提供者使用HTTP和XML将其元数据提供给服务。借助该协议,可以将来自多个源的元数据收集到一个数据库中,从而为这些收割或聚合的数据提供访问。