文档类型与模式语言解析
在信息处理和文档管理领域,理解不同类型的文档以及相应的模式语言至关重要。下面将详细介绍文档中心型与数据中心型内容的区别,以及三种重要的文档模式语言。
1. 文档中心型与数据中心型内容
在文档处理中,存在两种并置的文档概念,即文档中心型内容模型和数据中心型内容模型。
数据中心型文档的例子有很多,像关系型数据库、电话簿、公司名录、索引卡和穿孔卡等。而文档中心型文档与数据中心型文档的主要区别在于,文档中心型内容遵循叙事逻辑,而数据中心型内容则不然。例如,电话簿中的条目是按名称的字母顺序排列的,关系型数据库表中的条目可以按用户要求的任何顺序检索,它们的元素顺序是由逻辑标准而非叙事决定的。
这两种文档形式并非相互排斥。文档中心型文档可能包含数据中心型部分,反之亦然。比如,一个按叙事方式撰写的产品描述可能包含一个列出产品特性的数据中心型表格;而一个数据中心型的产品目录可能在每个产品条目中包含描述性元素(小型叙事)。从历史上看,数据中心型文档可能和文档中心型文档一样古老,甚至更古老,因为文字最初是为了记录信息而发明的。
2. 文档模式
文档模式通过定义文档结构和内容的约束来定义文档类型。如果一个文档实例符合给定的文档模式,那么它就属于该文档模式所定义的文档类型。当两个文档模式定义的文档类型相同时,我们称这两个模式定义是等价的。
对文档内容的约束会影响文档的语义,而对文档结构的约束可以看作是语法约束。结构约束可以借助形式文法来很好地描述,文档实例可以被视为某种形式语言的句子。
下面介绍三种定义相同文档类型的文档模式语言:DTD、XML Schema 和 Relax NG