数字信息长期保存与可信数字对象的应用探索
在当今数字化时代,数字信息的长期保存成为了一个至关重要的问题。随着科技的飞速发展,大量的信息以数字形式产生和存储,如公共记录、工程设计、法律文件、医疗病历以及艺术和学术作品等。如何确保这些数字信息在未来仍然可用、可理解,是我们面临的一大挑战。
1. 数字对象的耐久性表示
在数字信息保存方面,简单数字对象如静态数据文件和过滤器类程序,可采用不依赖短暂技术的标准进行保存,因为这些标准能被精确且清晰地定义。然而,对于更复杂的数据格式,可借助相对简单的虚拟机指令集来编码文件,使其持久可理解和有用。这通过创建通用虚拟计算机(UVC)程序来实现,该程序伴随当前内容,为后代呈现这些信息。
UVC具有诸多优点,其定义简单,完整规范易于理解。通过在不兼容的计算平台之间移植信息,可测试持久编码解决方案。创建和模拟UVC程序的每个步骤,基本能力的程序员都能执行。而且,所需的UVC代码量相对要保存的信息量以及其他文档管理程序来说较小,单个UVC定义足以涵盖所有数据类型和时间,一套UVC程序能满足人们想要保存的各种文件类型,一个UVC解释器适用于所有感兴趣的计算机执行架构。
不过,对于采用专有文件类型表示的对象,使用这种方法可靠保存可能存在困难。例如,Microsoft Office生成的文件,由于其所有者选择隐藏表示方式或坚持版权限制禁止创建衍生作品,难以保存。澳大利亚国家档案馆选择将此类对象转换为符合常用XML子集相对简单标准的XML格式进行保存。
在保存过程中,保存包可包含当前的位串,不丢弃任何位,不更改任何细节,这样持久编码不会干扰以新方式利用保存信息的创新,因为能保存当今环境的所有关键细节。