1、定义子元素
例子:
<!ELEMENT myelement (A, B+, C*, D?)>
解释:
A、B、C 和 D 是在例中代表 元素myelement 的子元素或子变量。
元素myelement 必须有:
正好一个 A
至少一个 B (由 加号+ 表示)
零个或多个 C (由 星号* 表示)
零个或一个 D (由 问号? 表示)
例子:
<!ELEMENT myelement (A | B | C)>
解释:
元素myelement 可能有 A 或 B 或 C 之一
例子:
<!ELEMENT myelement EMPTY>
解释:
元素myelement 不包含任何内容
例子:
<!ELEMENT myelement ANY>
解释:
元素myelement 可以包含在 DTD 中列出的任何元素
例子:
<!ELEMENT myelement (#PCDATA|myelement2)*>
解释:
元素myelement 可能包含经过语法分析的 字符数据 或 另一个元素( myelement2 )。
元素属性 #PCDATA 表明 定义的元素 可能包含经过语法分析的字符数据(在这种情况下是文本)
星号(*)表示混合内容模型 — 其中元素可以包含不同类型的属性。
例子:
<!ELEMENT other ANY>
解释:
元素other 标记的内容类型是 ANY 。这表示 <other> 可能包含所有以前已在 同DTD文档 中声明过的其它元素。
2、定义实体ENTITY
例子:
<!ENTITY IBM "Proud to work for IBM"> <job>&IBM;</job>
解释:
实体引用用于代替在 DTD 文档中定义的特定字符或字符串。
元素job 包含了对 实体IBM 的引用。进行了语法分析后,该实体引用将读作:
<job> Proud to work for IBM </job>
3、定义元素属性
例子:
<!ELEMENT myelement EMPTY> <!ATTLIST myelement att1 ID #IMPLIED att2 CDATA #FIXED "A" att3 CDATA #REQUIRED >
解释:
例子表明 元素myelement 是一个包含三个属性的空标记:
属性 1( att1 )是一个可选属性,ID 属性表明必须填入唯一的标识,每个元素只能有一个 ID 属性
属性 2( att2 )是带有固定值 "A" 的属性,属性 CDATA 表示包括的信息应该是文本
属性 3( att3 )是必需的文本属性。
可以看到在 XML 文档中使用的这个元素如下:
<myelement att2="A" att3="MustHave"/>
4、CDATA用法
CDATA 用于对所有若不进行转义就会以 XML 语言解释的任何数据进行转义,例如:
<![CDATA[<greeting>5000</greeting>]]>
如果适当的格式化,这一行将以文本内容显示:
<greeting> 5000 </greeting>
5、关于 XML 的几点说明
对 XML 的深入探讨主要考虑的是文档头中的几个元素,从以下开始:
<?xml version="1.0"?>
每个 XML 文档都必须包含这样的一个头,向 XML 语法分析器表示它是一个 XML 文档。
头中的下一行告诉 XML 语法分析器该文档是使用什么字符编码来创建的:
<?xml version="1.0" encoding="UTF-8"?>
在 Unix 系统上创建的 XML 文档和在 Windows 系统上创建的 XML 文档可能有不同的编码。
还可以为第一行设置可选的 standalone 属性。standalone 的缺省值是 no。 no 值表示该 DTD 定义是在另一个文件中描述的。yes 值表明该 DTD 应该在 XML 文档内部定义。如果设置,它应该看起来如下:
<?xml version="1.0" standalone='yes'?> <!DOCTYPE people [ <!ELEMENT people (person+)> <!ELEMENT person (#PCDATA)> ]>
如果不设置,应该如下:
<?xml version="1.0" ?> <!DOCTYPE people SYSTEM "people.dtd">