信息结构描述全解析
在信息管理和数字化领域,准确描述信息结构至关重要,它关乎着信息的存储、传输、理解和利用。下面将深入探讨相关的核心概念和技术。
1. 专著与馆藏
每一份文档都与其他文档存在关联,这些关联对其解读和来源证明至关重要。我们通常用引用、链接或指针来表示这些关联,但并非所有关联都是明确的,在人类交流中,大多数关联是隐含的,基于“共享社会背景”。
对于复杂的作品,为了使其能被正确理解或按照提供者的意图执行,需要特定的程序和模式信息。这些辅助信息应与主要作品一样易于获取。由于每个辅助数据单元可能会被多个主要对象实例使用,因此将其作为独立的存档作品保存既方便又高效。这种递归模式最终会收敛到一个小的馆藏集合,其描述无需借助存档馆藏就能被人类理解和使用。
部分人认为馆藏是图书馆的一种属性,但其实任何馆藏都可以通过一份文档来定义,该文档会详细列出或识别馆藏成员,传统的图书馆目录就是这样的定义方式。这种定义馆藏的方式在数字图书馆中比在传统图书馆中更强大,因为在传统图书馆中,每个实体馆藏在任何时刻只能属于一个实体馆藏集合,而在数字图书馆中,这种限制几乎没有意义。
在实际应用中,几乎每份文档都定义了一个馆藏,即它所引用的文档和其他对象的集合。在具体实现中,XML 会作为各个数据块之间的“粘合剂”使用,而且图中所示的子结构可能为空对象。
图 12 展示了一种数字对象模型,其中突出显示的关联类型与图书馆员所说的检索工具的主要内容相似。例如,在梵蒂冈图书馆,你可以看到一个房间里存放着检索工具,其中包含描述 16 世纪馆藏的 19 世纪作品。
2. 数字对象模式
工程师们在处理技术约束明确、每