在XML技术里,可以编写一个文档来约束一个XML文档的书写规范,这称之为XML约束。
DTD(DocumentType Definition),全称为文档类型定义。DTD约束即可以作为一个单独的文件编写,也可以在XML文件内编写。
示例如下:
book.xml
<?xmlversion="1.0" ?>
<!DOCTYPE 书架 SYSTEM "book.dtd">
<书架>
<书>
<书名>Java就业培训教程</书名>
<作者>redarmy</作者>
<售价>39.00元</售价>
</书>
<书>
<书名>JavaScript网页开发</书名>
<作者>redarmy</作者>
<售价>28.00元</售价>
</书>
</书架>
book.dtd
<!ELEMENT 书架 (书+)>
<!ELEMENT 书 (书名,作者,售价)>
<!ELEMENT 书名 (#PCDATA)>
<!ELEMENT 作者 (#PCDATA)>
<!ELEMENT 售价 (#PCDATA)>
在xml文件内编写DTD
<?xmlversion="1.0" encoding="UTF-8"standalone="yes"?>
<!DOCTYPE 书架 [
<!ELEMENT 书架 (书+)>
<!ELEMENT 书 (书名,作者,售价)>
<!ELEMENT 书名 (#PCDATA)>
<!ELEMENT 作者 (#PCDATA)>
<!ELEMENT 售价 (#PCDATA)>
]>
<书架>
<书>
<书名>Java就业培训教程</书名>
<作者>redarmy</作者>
<售价>39.00元</售价>
</书>
</书架>
如何在xml文件中引用dtd约束:
•当引用的文件在本地时,采用如下方式:
<!DOCTYPE 文档根结点 SYSTEM "DTD文件的URL">
例如: <!DOCTYPE 书架 SYSTEM “book.dtd”>
•当引用的文件是一个公共的文件时,采用如下方式:
<!DOCTYPE 文档根结点 PUBLIC "DTD名称" "DTD文件的URL">
DTD约束语法细节
1.元素定义
2.属性定义
3.实体定义
元素
l在DTD文档中使用ELEMENT声明一个XML元素,语法格式如下所示:
<!ELEMENT元素名称 元素类型>
l元素类型可以是元素内容、或类型
•如为元素内容:则需要使用()括起来,如
<!ELEMENT 书架 (书名,作者,售价)>
<!ELEMENT 书名 (#PCDATA)>
•如为元素类型,则直接书写,DTD规范定义了如下几种类型:
•EMPTY:用于定义空元素,例如<br/> <hr/>
•ANY:表示元素内容为任意类型。
l元素内容中可以使用如下方式,描述内容的组成关系
•用逗号分隔,表示内容的出现顺序必须与声明时一致。<!ELEMENT MYFILE (TITLE,AUTHOR,EMAIL)>
•用|分隔,表示任选其一,即多个只能出现一个
<!ELEMENT MYFILE(TITLE|AUTHOR|EMAIL)>
l在元素内容中也可以使用+、*、?等符号表示元素出现的次数:
+: 一次或多次 (书+)
?:0次或一次 (书?)
*: 0次或多次 (书*)
l也可使用圆括号( )批量设置,例
<!ELEMENT MYFILE ((TITLE*, AUTHOR?,EMAIL)* | COMMENT)>
属性
l xml文档中的标签属性需通过ATTLIST为其设置属性
l 语法格式:
<!ATTLIST 元素名
属性名1 属性值类型 设置说明
属性名2 属性值类型 设置说明
……
>
l 属性声明举例:
<!ATTLIST 商品
类别 CDATA #REQUIRED
颜色 CDATA #IMPLIED
>
l 对应XML文件:
<商品类别="服装" 颜色="黄色">…</商品>
<商品类别="服装">…</商品>
l 设置说明:
•#REQUIRED:必须设置该属性
•#IMPLIED:可以设置也可以不设置
•#FIXED:说明该属性的取值固定为一个值,在 XML 文件中不能为该属性设置其它值。但需要为该属性提供这个值
•直接使用默认值:在 XML 中可以设置该值也可以不设置该属性值。若没设置则使用默认值。
实体
l实体用于为一段内容创建一个别名,以后在XML文档中就可以使用别名引用这段内容了。
l在DTD定义中,一条<!ENTITY…>语句用于定义一个实体。
l实体可分为两种类型:引用实体和参数实体。
l引用实体主要在 XML 文档中被应用
l语法格式:
•<!ENTITY 实体名称 “实体内容” >:直接转变成实体内容
l引用方式:
&实体名称;
l举例:
<!ENTITY copyright “I am a programmer">
……
©right;
l参数实体被 DTD 文件自身使用
l 语法格式:
<!ENTITY % 实体名称 "实体内容" >
l 引用方式:
%实体名称;
l举例1:
<!ENTITY % TAG_NAMES "姓名 | EMAIL | 电话 | 地址">
<!ELEMENT 个人信息 (%TAG_NAMES; | 生日)>
<!ELEMENT 客户信息 (%TAG_NAMES; | 公司名)>
l举例2:
<!ENTITY %common.attributes
" id ID #IMPLIED
account CDATA #REQUIRED "
>
...
<!ATTLISTpurchaseOrder %common.attributes;>
<!ATTLISTitem %common.attributes;>