XML(2)
XML约束概述
什么是XML约束
在XML技术里,可以编写一个文档来约束一个XML文档的书写规范,这称之为XML约束。
为什么需要XML约束
常用的约束技术
XMLDTD
XMLSchema
DTD约束快束入门
DTD(DocumentTypeDefinition),全称为文档类型定义
文件清单:book.xml
<?xmlversion="1.0"?>
<!DOCTYPE书架SYSTEM"book.dtd">
<书架>
<书>
<书名>Java就业培训教程</书名>
<作者>redarmy</作者>
<售价>39.00元</售价>
</书>
<书>
<书名>JavaScript网页开发</书名>
<作者>redarmy</作者>
<售价>28.00元</售价>
</书>
</书架>
文件清单:book.dtd
<!ELEMENT书架(书+)>
<!ELEMENT书(书名,作者,售价)>
<!ELEMENT书名(#PCDATA)>
<!ELEMENT作者(#PCDATA)>
<!ELEMENT售价(#PCDATA)>
注意:DTD文件应使用UTF-8或Unicode
编程校验XML文档正确性
IE5以上浏览器内置了XML解析工具:Microsort.XMLDOM,开发人员可以编写javascript代码,利用这个解析工具装载xml文件,并对xml文件进行dtd验证。
创建xml文档解析器对象
varxmldoc=newActiveXObject("Microsoft.XMLDOM");
开启xml校验
xmldoc.validateOnParse="true";
装载xml文档
xmldoc.load("book.xml");
获取错误信息
xmldoc.parseError.reason;
xmldoc.parseError.line
编写DTD约束的两种方式
DTD约束即可以作为一个单独的文件编写,也可以在XML文件内编写
在xml文件内编写DTD
<?xmlversion="1.0"encoding="UTF-8"standalone="yes"?>
<!DOCTYPE书架[
<!ELEMENT书架(书+)>
<!ELEMENT书(书名,作者,售价)>
<!ELEMENT书名(#PCDATA)>
<!ELEMENT作者(#PCDATA)>
<!ELEMENT售价(#PCDATA)>
]>
<书架>
<书>
<书名>Java就业培训教程</书名>
<作者>redarmy</作者>
<售价>39.00元</售价>
</书>
...
</书架>
引用DTD约束
XML文件使用DOCTYPE声明语句来指明它所遵循的DTD文件,DOCTYPE声明语句有两种形式:
当引用的文件在本地时,采用如下方式:
<!DOCTYPE文档根结点SYSTEM"DTD文件的URL">
例如:<!DOCTYPE书架SYSTEM“book.dtd”>。在xml文件中手写一下。
当引用的文件是一个公共的文件时,采用如下方式:
<!DOCTYPE文档根结点PUBLIC"DTD名称""DTD文件的URL">
例如:<!DOCTYPEweb-appPUBLIC
"-//SunMicrosystems,Inc.//DTDWebApplication2.3//EN"
"http://java.sun.com/dtd/web-app_2_3.dtd">
DTD约束语法细节
元素定义
在DTD文档中使用ELEMENT声明一个XML元素,语法格式如下所示:
<!ELEMENT元素名称元素类型>
元素类型可以是元素内容、或类型
如为元素内容:则需要使用()括起来,如
<!ELEMENT书架(书名,作者,售价)>
<!ELEMENT书名(#PCDATA)>
如为元素类型,则直接书写,DTD规范定义了如下几种类型:
EMPTY:用于定义空元素,例如<br/><hr/>
ANY:表示元素内容为任意类型。
元素内容中可以使用如下方式,描述内容的组成关系
用逗号分隔,表示内容的出现顺序必须与声明时一致。<!ELEMENTMYFILE(TITLE,AUTHOR,EMAIL)>
用|分隔,表示任选其一,即多个只能出现一个
<!ELEMENTMYFILE(TITLE|AUTHOR|EMAIL)>
在元素内容中也可以使用+、*、?等符号表示元素出现的次数:
+:一次或多次(书+)
?:0次或一次(书?)
*:0次或多次(书*)
也可使用圆括号()批量设置,例
<!ELEMENTMYFILE((TITLE*,AUTHOR?,EMAIL)*|COMMENT)>
属性定义
xml文档中的标签属性需通过ATTLIST为其设置属性
语法格式:
<!ATTLIST元素名
属性名1属性值类型设置说明
属性名2属性值类型设置说明
……
>
属性声明举例:
<!ATTLIST商品
类别CDATA#REQUIRED
颜色CDATA#IMPLIED
>
对应XML文件:
<商品类别="服装"颜色="黄色">…</商品>
<商品类别="服装">…</商品>
设置说明:
#REQUIRED:必须设置该属性
#IMPLIED:可以设置也可以不设置
#FIXED:说明该属性的取值固定为一个值,在XML文件中不能为该属性设置其它值。但需要为该属性提供这个值
直接使用默认值:在XML中可以设置该值也可以不设置该属性值。若没设置则使用默认值。
举例:
<!ATTLIST页面作者
姓名CDATA#IMPLIED
年龄CDATA#IMPLIED
联系信息CDATA#REQUIRED
网站职务CDATA#FIXED"页面作者"
个人爱好CDATA"上网"
>
常用属性值类型
CDATA:表示属性值为普通文本字符串。
ENUMERATED
ID
ENTITY(实体)
属性值类型àENUMERATED
属性的类型可以是一组取值的列表,在XML文件中设置的属性值只能是这个列表中的某个值(枚举)
<?xmlversion="1.0"encoding="GB2312"standalone="yes"?>
<!DOCTYPE购物篮[
<!ELEMENT肉EMPTY>
<!ATTLIST肉品种(鸡肉|牛肉|猪肉|鱼肉)"鸡肉">
]>
<购物篮>
<肉品种="鱼肉"/>
<肉品种="牛肉"/>
<肉/>
</购物篮>
属性值类型àID
表示属性的设置值为一个唯一值。
ID属性的值只能由字母,下划线开始,不能出现空白字符
<?xmlversion="1.0"encoding="GB2312"?>
<!DOCTYPE联系人列表[
<!ELEMENT联系人列表ANY>
<!ELEMENT联系人(姓名,EMAIL)>
<!ELEMENT姓名(#PCDATA)>
<!ELEMENTEMAIL(#PCDATA)>
<!ATTLIST联系人编号ID#REQUIRED>
]>
<联系人列表>
<联系人编号="1">
<姓名>张三</姓名>
<EMAIL>zhang@it315.org</EMAIL>
</联系人>
<联系人编号="2">
<姓名>李四</姓名>
<EMAIL>li@it315.org</EMAIL>
</联系人>
</联系人列表>
实体定义
实体用于为一段内容创建一个别名,以后在XML文档中就可以使用别名引用这段内容了。
在DTD定义中,一条<!ENTITY…>语句用于定义一个实体。
实体可分为两种类型:引用实体和参数实体。
实体定义à引用实体
引用实体主要在XML文档中被应用
语法格式:
<!ENTITY实体名称“实体内容”>:直接转变成实体内容
引用方式:
&实体名称;
举例:
<!ENTITYcopyright“Iamaprogrammer">
……
©right;
实体定义à参数实体
参数实体被DTD文件自身使用
语法格式:
<!ENTITY%实体名称"实体内容">
引用方式:
%实体名称;
举例1:
<!ENTITY%TAG_NAMES"姓名|EMAIL|电话|地址">
<!ELEMENT个人信息(%TAG_NAMES;|生日)>
<!ELEMENT客户信息(%TAG_NAMES;|公司名)>
举例2:
<!ENTITY%common.attributes
"idID#IMPLIED
accountCDATA#REQUIRED"
>
...
<!ATTLISTpurchaseOrder%common.attributes;>
<!ATTLISTitem%common.attributes;>