长期数字对象架构:持久存储与管理之道
1. 数字信息保存的策略与挑战
在数字时代,古老的保存方法经过调整后,能为数字信息保存带来高效且令人满意的效果。将副本存放在广泛分散且自主的存储库中,对数字作品而言既有效又易于实施。为实现相关目标,可从以下几个方面着手:
- 内容服务器 :存储打包好的作品,并为馆藏提供搜索和访问服务。
- 复制机制 :防止任何作品的最后一份副本丢失。
- 作品包装 :将每件作品与元数据一起打包,元数据应包含来源声明以及相关作品、本体、渲染软件和包块之间的可靠链接。
- 内容表示 :使用不受环境中无关和短暂因素影响的语言来表示内容。
- 编码标准 :采用一些社会认可的语言和标准作为编码起点。
- 专业本体 :由专业社区定义、标准化和维护特定主题的本体。
信息提供者可根据风险评估选择不太可靠的方法。若风险较高的替代方法成本远低于最佳方法,那么选择它是合理的。在无法获取避免所有可能错误所需的关键信息时,这或许也是必要的,比如数据模式属于商业机密或受知识产权限制的情况,Adobe Acrobat 和 Microsoft Office 组件就是典型例子。
数字对象的保存与其他信息服务有所不同,它面临着特殊的挑战。生产者(如作者、艺术家、程序员等)需在不确定消费者目标和计算机技术信息的情况下,预见并满足其重要需求。自动化软件也必须提前预见并准备应对可能出现的异常情况。这往往促使我们重新审