转自:http://www.ibm.com/developerworks/cn/xml/x-dtdint/index.html
A、B、C 和 D 是在下例中代表元素的变量。
元素必须有正好一个 A
、至少一个 B
(由加号表示)、零个或多个 C
(由星号表示)以及零个或一个 D
(由问号表示):
<!ELEMENT element (A, B+, C*, D?)> |
元素可能有 A
或 B
或 C
之一:
<!ELEMENT element (A | B | C)> |
元素不包含任何内容:
<!ELEMENT element EMPTY> |
元素可以包含在 DTD 中列出的任何元素:
<!ELEMENT element ANY> |
元素可能包含经过语法分析的字符数据或另一个元素( element2
)。星号(*)表示混合内容模型 — 其中元素可以包含不同类型的属性。
<!ELEMENT element (#PCDATA|element2)*> |
下例将文本 "entity reference" 插到文档中它出现的任何地方:
<!ENTITY element "entity reference"> |
可以看到在 XML 文档中该实体引用元素如下:
&element; |
下例表明其元素是一个包含三个属性的空标记:属性 1( att1
)是一个可选属性,属性 2( att2
)是带有固定值 "A"
的属性,属性 3( att3
)是必需的文本属性。
<!ELEMENT element EMPTY> <!ATTLIST element att1 ID #IMPLIED att2 CDATA #FIXED "A" att3 CDATA #REQUIRED> |
可以看到在 XML 文档中使用的这个元素如下:
<element att2="A" att3="MustHave"/> |
属性 CDATA
表示包括的信息应该是文本。 ID
属性表明必须填入唯一的标识。每个元素只能有一个 ID
属性。另外, CDATA
表示att2
和 att3
可能包含任何字符串。
如果您对该语法还未完全熟悉,请继续阅读。下一部分中的工作示例应该能帮助您消除疑虑。
可以使用 Microsoft Internet Explorer 5 或更高版本查看清单 4 中显示的 XML 文档 ― 前面示例中使用的 people.xml 文件的扩展版本。如果在 IE5 中打开 people.xml,应该看到一个树结构。这是因为 IE5 带有能够将 XML 文档语法分析成元素树的 XML 语法分析器。
还可以在 参考资料中找到这个文件及其 DTD。
清单 4. people.xml 的完整清单
<?xml version="1.0"?> <!DOCTYPE people SYSTEM "people.dtd"> <people> <person> <name> <firstname>Jane</firstname> <lastname>Fung</lastname> </name> <look>good-looking</look> <possession> <car> <model>Civic</model> </car> <job>&IBM;</job> </possession> </person> <person> <name> <firstname>G.I.</firstname> <lastname>Jane</lastname> </name> <look>tough</look> <possession> <house country="CANADA" city="Toronto"> <townhouse townhouse_type="good" /> </house> <bankaccount bankaccount_number="sg-123"> <![CDATA[<greeting>5000</greeting>]]> </bankaccount> </possession> <other> <car>she has a car</car> <house country="CANADA" city="Toronto"> <townhouse townhouse_type="good" /> </house> </other> </person> </people> |
对 XML 的深入探讨主要考虑的是文档头中的几个元素,从以下开始:
<?xml version="1.0"?> |
每个 XML 文档都必须包含这样的一个头,向 XML 语法分析器表示它是一个 XML 文档。头中的下一行告诉 XML 语法分析器该文档是使用什么字符编码来创建的:
<!DOCTYPE people SYSTEM "people.dtd"> |
在 Unix 系统上创建的 XML 文档和在 Windows 系统上创建的 XML 文档可能有不同的编码。
还可以为第一行设置可选的 standalone
属性。standalone 的缺省值是 no。 no 值表示该 DTD 定义是在另一个文件中描述的。 yes值表明该 DTD 应该在 XML 文档内部定义。我没有为示例设置这个属性;如果想设置,它应该看起来如下:
<?xml version="1.0" standalone='yes'?> <!DOCTYPE people [ <!ELEMENT people (person+)> <!ELEMENT person (#PCDATA)> ]> |
还应该注意使这个文档格式正确的方法。例如,所有空标记都用一个右斜杠结束,如下所示:
<townhouse townhouse_type="good" /> |
还请注意 CDATA
用于对所有若不进行转义就会以 XML 语言解释的任何数据进行转义,例如:
<![CDATA[<greeting>5000</greeting>]]> |
如果适当的格式化,这一行将以文本内容显示:
<greeting> 5000 </greeting> |
可以从 XML 文件的进一步研究中获益,甚至可能从对您自己的文件运行 XML 语法分析器获益(请参阅 参考资料)。但是现在,让我们看一下 people.xml 文件的 DTD。
清单 5. people.dtd 的完整清单
<!ELEMENT people (person+)> <!ELEMENT person (name, look*, possession?, other?)> <!ELEMENT name (firstname, lastname)> <!ELEMENT firstname (#PCDATA)> <!ELEMENT lastname (#PCDATA)> <!ELEMENT look (#PCDATA)> <!ELEMENT possession (car?, house?, bankaccount?, job?)> <!ELEMENT car (#PCDATA|model)*> <!ELEMENT model (#PCDATA)> <!ELEMENT house (apartment|standalone|townhouse)> <!ATTLIST house house_area ID #IMPLIED country CDATA #FIXED "CANADA" city CDATA #IMPLIED> <!ELEMENT apartment EMPTY> <!ELEMENT standalone EMPTY> <!ELEMENT townhouse EMPTY> <!ATTLIST townhouse townhouse_type ID #IMPLIED> <!ELEMENT bankaccount (#PCDATA)> <!ATTLIST bankaccount bankaccount_number ID #REQUIRED> <!ELEMENT job (#PCDATA)> <!ELEMENT other ANY> <!ENTITY IBM "Proud to work for IBM"> |
使用 快速指南作为参考,通过比较 XML 文件及其 DTD,您应该能够方便地定义 DTD 和 XML 文件中各元素之间的关系。不过,还有两个剩下的元素,您可能感兴趣。
清单 4 包含了对实体的引用。
<job>&IBM;</job> |
实体引用用于代替在 DTD 文档中定义的特定字符或字符串。进行了语法分析后,该实体引用将读作:
<job> Proud to work for IBM </job> |
还应该注意, <other>
标记的内容类型是 ANY
。这表示 <other>
可能包含所有以前已在 DTD 中声明过的元素。因此, other
元素可能包含 car
和 house
元素,如下:
<other> <car>she has a car</car> <house country="CANADA" city="Toronto"> <townhouse townhouse_type="good" /> </house> </other> |