DTD 语法快速指南

最新推荐文章于 2020-12-21 18:56:19 发布

转载最新推荐文章于 2020-12-21 18:56:19 发布 · 1k 阅读

文章标签：

#xml #文档 #reference #microsoft #ibm #system

Database 专栏收录该内容

30 篇文章

订阅专栏

转自：http://www.ibm.com/developerworks/cn/xml/x-dtdint/index.html

A、B、C 和 D 是在下例中代表元素的变量。

元素必须有正好一个 A 、至少一个 B （由加号表示）、零个或多个 C （由星号表示）以及零个或一个 D （由问号表示）：

<!ELEMENT element (A, B+, C*, D?)>

元素可能有 A 或 B 或 C 之一：

<!ELEMENT element (A | B | C)>

元素不包含任何内容：

<!ELEMENT element EMPTY>

元素可以包含在 DTD 中列出的任何元素：

<!ELEMENT element ANY>

元素可能包含经过语法分析的字符数据或另一个元素（ element2 ）。星号（*）表示混合内容模型 — 其中元素可以包含不同类型的属性。

<!ELEMENT element (#PCDATA|element2)*>

下例将文本 "entity reference" 插到文档中它出现的任何地方：

<!ENTITY element "entity reference">

可以看到在 XML 文档中该实体引用元素如下：

&element;

下例表明其元素是一个包含三个属性的空标记：属性 1（ att1 ）是一个可选属性，属性 2（ att2 ）是带有固定值 "A" 的属性，属性 3（ att3 ）是必需的文本属性。

   <!ELEMENT element EMPTY>
     
        
        <!ATTLIST element

     att1 ID #IMPLIED

     att2 CDATA #FIXED "A"

     att3 CDATA #REQUIRED>

可以看到在 XML 文档中使用的这个元素如下：

<element att2="A" att3="MustHave"/>

属性 CDATA 表示包括的信息应该是文本。 ID 属性表明必须填入唯一的标识。每个元素只能有一个 ID 属性。另外， CDATA 表示att2 和 att3 可能包含任何字符串。

如果您对该语法还未完全熟悉，请继续阅读。下一部分中的工作示例应该能帮助您消除疑虑。

回页首

工作示例

可以使用 Microsoft Internet Explorer 5 或更高版本查看清单 4 中显示的 XML 文档 ― 前面示例中使用的 people.xml 文件的扩展版本。如果在 IE5 中打开 people.xml，应该看到一个树结构。这是因为 IE5 带有能够将 XML 文档语法分析成元素树的 XML 语法分析器。

还可以在参考资料中找到这个文件及其 DTD。

清单 4. people.xml 的完整清单

<?xml version="1.0"?>

<!DOCTYPE people SYSTEM "people.dtd">

<people>

    <person>
        <name>

            <firstname>Jane</firstname>

            <lastname>Fung</lastname>

        </name>

        <look>good-looking</look>

        <possession>

            <car>

                <model>Civic</model>

            </car>

            <job>&IBM;</job>

        </possession>

    </person>

    <person>

        <name>

            <firstname>G.I.</firstname>

            <lastname>Jane</lastname>

        </name>

        <look>tough</look>

        <possession>

            <house country="CANADA" city="Toronto">

            </house>

            <bankaccount bankaccount_number="sg-123">
    <![CDATA[<greeting>5000</greeting>]]>

            </bankaccount>

        </possession>

        <other>

            <car>she has a car</car>

            <house country="CANADA" city="Toronto">

                <townhouse townhouse_type="good" />

            </house>

        </other>

    </person>

</people>

关于 XML 的几点说明

对 XML 的深入探讨主要考虑的是文档头中的几个元素，从以下开始：

<?xml version="1.0"?>

每个 XML 文档都必须包含这样的一个头，向 XML 语法分析器表示它是一个 XML 文档。头中的下一行告诉 XML 语法分析器该文档是使用什么字符编码来创建的：

<!DOCTYPE people SYSTEM "people.dtd">

在 Unix 系统上创建的 XML 文档和在 Windows 系统上创建的 XML 文档可能有不同的编码。

还可以为第一行设置可选的 standalone 属性。standalone 的缺省值是 no。 no 值表示该 DTD 定义是在另一个文件中描述的。 yes值表明该 DTD 应该在 XML 文档内部定义。我没有为示例设置这个属性；如果想设置，它应该看起来如下：

   <?xml version="1.0" standalone='yes'?>
     <!DOCTYPE people [
     <!ELEMENT people (person+)>
     <!ELEMENT person (#PCDATA)>
     ]>

还应该注意使这个文档格式正确的方法。例如，所有空标记都用一个右斜杠结束，如下所示：

<townhouse townhouse_type="good" />

还请注意 CDATA 用于对所有若不进行转义就会以 XML 语言解释的任何数据进行转义，例如：

<![CDATA[<greeting>5000</greeting>]]>

如果适当的格式化，这一行将以文本内容显示：

<greeting> 5000 </greeting>

可以从 XML 文件的进一步研究中获益，甚至可能从对您自己的文件运行 XML 语法分析器获益（请参阅参考资料）。但是现在，让我们看一下 people.xml 文件的 DTD。

清单 5. people.dtd 的完整清单

<!ELEMENT people (person+)>
<!ELEMENT person (name, look*, possession?, other?)>
<!ELEMENT name (firstname, lastname)>
<!ELEMENT firstname (#PCDATA)>
<!ELEMENT lastname (#PCDATA)>
<!ELEMENT look (#PCDATA)>
<!ELEMENT possession (car?, house?, bankaccount?, job?)>
<!ELEMENT car (#PCDATA|model)*>
<!ELEMENT model (#PCDATA)>
<!ELEMENT house (apartment|standalone|townhouse)>
<!ATTLIST house house_area ID #IMPLIED country CDATA #FIXED 
"CANADA" city CDATA #IMPLIED>
<!ELEMENT apartment EMPTY>
<!ELEMENT standalone EMPTY>
<!ELEMENT townhouse EMPTY>
<!ATTLIST townhouse townhouse_type ID #IMPLIED>
<!ELEMENT bankaccount (#PCDATA)>
<!ATTLIST bankaccount bankaccount_number ID #REQUIRED>
<!ELEMENT job (#PCDATA)>
<!ELEMENT other ANY>
<!ENTITY IBM "Proud to work for IBM">

关于 DTD 的几点说明

使用快速指南作为参考，通过比较 XML 文件及其 DTD，您应该能够方便地定义 DTD 和 XML 文件中各元素之间的关系。不过，还有两个剩下的元素，您可能感兴趣。

清单 4 包含了对实体的引用。

<job>&IBM;</job>

实体引用用于代替在 DTD 文档中定义的特定字符或字符串。进行了语法分析后，该实体引用将读作：

<job> Proud to work for IBM </job>

还应该注意， <other> 标记的内容类型是 ANY 。这表示 <other> 可能包含所有以前已在 DTD 中声明过的元素。因此， other 元素可能包含 car 和 house 元素，如下：

   <other>
         <car>she has a car</car>
         <house country="CANADA" city="Toronto">
             <townhouse townhouse_type="good" />
         </house>
     </other>