XML-Schema约束
- XML是一种可扩展标记语言,用于标记电子文件使其具有结构性的标记语言
- 可以用来标记数据、定义数据类型
- 是一种允许用户对自己的标记语言进行定义的源语言
- 可扩展标记语言是标准通用标记语言的子集,非常适合 Web 传输。
先从最简单的入手
1.最简单的Schema文档
如何写一个最简单的XML Schema文档呢?
首先,我们写出一个最简单的XML文档。
First.xml
<?xml version="1.0" encoding="UTF-8"?>
<greeting>Hello World</greeting>
<!-- 有一个根元素:greeting;且这个元素不含属性,无子元素,内容是字符串 -->
First.xsd
<?xml version="1.0" encoding="UTF-8"?>
<!-- 命名空间 -->
<xsd:schema xmlns:xsd="http://www.w3.org/2001/XMLSchema">
<xsd:element name="greeting" type="xsd:string"></xsd:element>
</xsd:schema>
XML Schema文档后缀名是.xsd,完全符合XML语法,根元素是schema,命名空间xmlns:xsd="http://www.w3.org/2001/XMLSchema,用元素定义实例文档中的元素,如greeting。
所有的属性均作为简易类型来声明。
简易元素指那些仅包含文本的元素。它不会包含任何其他的元素或属性。
简易元素无法拥有属性。假如某个元素拥有属性,它就会被当作某种复合类型
2.含子元素的Schema文档
实例文档如下
First.xml
<?xml version="1.0" encoding="UTF-8"?>
<First2>
<name>teike</name>
<address>No.123,Road waitan,Shanghai</address>
</First2>
First.xsd
<?xml version="1.0" encoding="UTF-8"?>
<xsd:schema xmlns:xsd="http://www.w3.org/2001/XMLSchema">
<xsd:element name="First2">
<xsd:complexType>
<xsd:sequence>
<xsd:element name="name" type="xsd:string"></xsd:element>
<xsd:element name="address" type="xsd:string"></xsd:element>
</xsd:sequence>
</xsd:complexType>
</xsd:element>
</xsd:schema>
实例文档customer.xml中,元素含有两个子元素,所以我们在Schema文档中采用ComplexType来定义该元素。sequence表示子元素依次出现的顺序。
3.含子元素和孙元素的Schema文档
比上面复杂点的实例文档
First3.xml
<?xml version="1.0" encoding="UTF-8"?>
<First3>
<name>Teike</name>
<address>
<prefecture>hunan</prefecture>
<city>changsha</city>
<street>Meixihu Road,No.123</street>
</address>
</First3>
First3.xsd
<?xml version="1.0" encoding="UTF-8"?>
<xsd:schema xmlns:xsd="http://www.w3.org/2001/XMLSchema">
<xsd:element name="First3">
<xsd:complexType>
<xsd:sequence>
<xsd:element name="name" type="xsd:string"></xsd:element>
<xsd:element name="address">
<xsd:complexType>
<xsd:sequence>
<xsd:element name="prefectrue" type="xsd:string"></xsd:element>
<xsd:element name="city" type="xsd:string"></xsd:element>
<xsd:element name="street" type="xsd:string"></xsd:element>
</xsd:sequence>
</xsd:complexType>
</xsd:element>
</xsd:sequence>
</xsd:complexType>
</xsd:element>
</xsd:schema>
First3-1.xsd
用ref元素来重新编写这个Schema文档
<?xml version="1.0" encoding="UTF-8"?>
<!-- 用ref元素重新编写Schema文档 -->
<!-- 用ref元素编写,可以直接将其指向另一个模块,使文档更加具有可读性 -->
<xsd:schema xmlns:xsd="http://www.w3.org/2001/XMLSchema">
<xsd:element name="First3">
<xsd:complexType>
<xsd:sequence>
<xsd:element name="name" type="xsd:string"></xsd:element>
<xsd:element name="address"></xsd:element>
</xsd:sequence>
</xsd:complexType>
</xsd:element>
<xsd:element name="address">
<xsd:complexType>
<xsd:sequence>
<xsd:element name="prefectrue" type="xsd:string"></xsd:element>
<xsd:element name="city" type="xsd:string"></xsd:element>
<xsd:element name="street" type="xsd:string"></xsd:element>
</xsd:sequence>
</xsd:complexType>
</xsd:element>
</xsd:schema>
4.定义相同子元素的数量
First4.xml
<?xml version="1.0" encoding="UTF-8"?>
<First4>
<orderItem>Accountion Book</orderItem>
<orderItem>Taxation Book</orderItem>
</First4>
假设元素,即每次的订购书目不能超过10种,那该怎么写这个Schema文档呢?这里要用到的maxOccurs属性。
First4.xsd
<?xml version="1.0" encoding="UTF-8"?>
<xsd:schema xmlns:xsd="http://www.w3.org/2001/XMLSchema">
<xsd:element name="First4">
<xsd:complexType>
<xsd:sequence>
<xsd:element name="orderItem" type="xsd:string"
maxOccurs="10"></xsd:element>
<!-- maxOccurs指的是orderItem元素最大可以有10个 -->
</xsd:sequence>
</xsd:complexType>
</xsd:element>
</xsd:schema>
第7行中的maxOccurs属性为10,代表orderItem元素可以最大有10个。如果,不设定元素个数,则可以用maxOccurs="unbounded"来定义。
类似,如果要定义最小值,可以使用minOccurs,比如下面这句:
<xsd:element name=“orderItem” type=“xsd:string” minOccurs=“5” maxOccurs=“10”/>
这两个属性缺省值都是1。
5.定义可选项的子元素
First5.xml
<?xml version="1.0" encoding="UTF-8"?>
<First5>
<orderItem>
<!-- 书名订购 -->
<name>Accounting Book</name>
</orderItem>
<orderItem>
<!-- 书号订购 -->
<id>1-3389-0062-6</id>
</orderItem>
</First5>
这时书写Schema文档还需要使用choice元素。
First5.xsd
<?xml version="1.0" encoding="UTF-8"?>
<xsd:schema xmlns:xsd="http://www.w3.org/2001/XMLSchema">
<xsd:element name="First5">
<xsd:complexType>
<xsd:sequence>
<xsd:element ref="orderItem" maxOccurs="10" ></xsd:element>
</xsd:sequence>
</xsd:complexType>
</xsd:element>
<xsd:element name="orderItem">
<xsd:complexType>
<xsd:choice>
<xsd:element name="name" type="xsd:string" ></xsd:element>
<xsd:element name="id" type="xsd:string" ></xsd:element>
</xsd:choice>
</xsd:complexType>
</xsd:element>
</xsd:schema>
稍微更复杂的可选项子元素
再稍微修改一下订书数据的实例文档:
First6.xml
<?xml version="1.0" encoding="UTF-8"?>
<First6>
<orderItem>
<!-- 书名订购 -->
<name>Accounting Book</name>
<quantity>2</quantity>
</orderItem>
<orderItem>
<!-- 书号订购 -->
<id>1-3389-0062-6</id>
</orderItem>
</First6>
这里假定值为1时,缺省。
如何修改Schema文档呢?
First6.xsd
<?xml version="1.0" encoding="UTF-8"?>
<xsd:schema xmlns:xsd="http://www.w3.org/2001/XMLSchema">
<xsd:element name="First6">
<xsd:complexType>
<xsd:sequence>
<xsd:element ref="orderItem" maxOccurs="10"/>
</xsd:sequence>
</xsd:complexType>
</xsd:element>
<xsd:element name="orderItem">
<xsd:complexType>
<xsd:sequence>
<xsd:choice>
<xsd:element name="name" type="xsd:string"/>
<xsd:element name="id" type="xsd:string"/>
</xsd:choice>
<xsd:element name="quantity" type="xsd:string" minOccurs="0"/>
</xsd:sequence>
</xsd:complexType>
</xsd:element>
</xsd:schema>
17行中的quantity最少出现值为0,也就是可以有,也可以没有。
当然,也可以直接在元素中,包含quantity,然后定义它的minOccurs。
6.自定义简单类型
如果内置简单类型的44种还不能满足要求,怎么办呢?下面学习自定义简单类型。(XML的扩展性充分体现在这里)
First7.xml
<?xml version="1.0" encoding="UTF-8"?>
<First7>
<orderItem>
<id>1-3389-0062-6</id>
<quantity>5</quantity>
</orderItem>
</First7>
First7.xsd
<?xml version="1.0" encoding="UTF-8"?>
<xsd:schema xmlns:xsd="http://www.w3.org/2001/XMLSchema">
<xsd:element name="First7">
<xsd:complexType>
<xsd:sequence>
<xsd:element ref="orderItem" maxOccurs="10"></xsd:element>
</xsd:sequence>
</xsd:complexType>
</xsd:element>
<xsd:element name="orderItem">
<xsd:complexType>
<xsd:sequence>
<xsd:element name="id" type="idType"></xsd:element>
<xsd:element name="quantity" type="xsd:integer"></xsd:element>
</xsd:sequence>
</xsd:complexType>
</xsd:element>
<xsd:simpleType name="idType">
<xsd:restriction base="xsd:string">
<xsd:pattern value="/d{1}-/d{4}-/d{4}-/d{1}"></xsd:pattern>
</xsd:restriction>
</xsd:simpleType>
</xsd:schema>
ID是一个标准的ISBN编码,我们怎么定义这个ISBN编码呢?
<xsd:simpleType name="idType">
<xsd:restriction base="xsd:string">
<xsd:pattern value="/d{1}-/d{4}-/d{4}-/d{1}"></xsd:pattern>
</xsd:restriction>
</xsd:simpleType>
idType是一个自定义的简单类型。
我们对它做了限制:
限定(restriction)用于为 XML 元素或者属性定义可接受的值。对 XML 元素的限定被称为 facet。
限定就暂时就讲 :对一个值的限定 和 对一组值得限定
<xsd:restriction base=“xsd:string”>代表它是基于一个字符串类型。再用pattern元素来描述该字符串的形式。
value="/d{1}-/d{4}-/d{4}-/d{1}"这是一个正则表达式
利用这个自定义的简单类型,我们可以重新写Schema文档
First7-1.xsd
<?xml version="1.0" encoding="UTF-8"?>
<xsd:schema xmlns:xsd="http://www.w3.org/2001/XMLSchema">
<xsd:element name="First7">
<xsd:complexType>
<xsd:sequence>
<xsd:element ref="orderItem" maxOccurs="10"></xsd:element>
</xsd:sequence>
</xsd:complexType>
</xsd:element>
<xsd:element name="orderItem">
<xsd:complexType>
<xsd:sequence>
<xsd:element name="id" type="idType"></xsd:element>
<xsd:element name="quantity" type="xsd:integer"></xsd:element>
</xsd:sequence>
</xsd:complexType>
</xsd:element>
<xsd:simpleType name="idType">
<xsd:restriction base="xsd:string">
<xsd:enumeration value="1-3389-0062-6"></xsd:enumeration>
<xsd:enumeration value="1-3091-2049-2"></xsd:enumeration>
<xsd:enumeration value="1-7237-7054-7"></xsd:enumeration>
</xsd:restriction>
</xsd:simpleType>
<xsd:simpleType name="quantityType">
<xsd:restriction base="xsd:integer">
<xsd:minInclusive value="1"></xsd:minInclusive>
<xsd:maxInclusive value="10"></xsd:maxInclusive>
</xsd:restriction>
</xsd:simpleType>
</xsd:schema>
假如我们事先确定好ID只有3个,即只有3个ISBN是可选的,那怎么办?我们可以用enumeration元素来进行列举。
<xsd:simpleType name="idType">
<xsd:restriction base="xsd:string">
<xsd:enumeration value="1-3389-0062-6"></xsd:enumeration>
<xsd:enumeration value="1-3091-2049-2"></xsd:enumeration>
<xsd:enumeration value="1-7237-7054-7"></xsd:enumeration>
</xsd:restriction>
</xsd:simpleType>
再来看订购量quantity的值,如果我们设定其值必须在1-10之间,该怎么办呢?可以这些自定义一个简单类型。
<xsd:simpleType name="quantityType">
<xsd:restriction base="xsd:integer">
<xsd:minInclusive value="1"></xsd:minInclusive>
<xsd:maxInclusive value="10"></xsd:maxInclusive>
</xsd:restriction>
</xsd:simpleType>
其中,minInclusive,maxInclusive分别代表该类型的取值范围。
所以最终修改后的Schema文档如下:
8.定义属性
元素的属性如何在Schema文档中定义。
First8.xml
<?xml version="1.0" encoding="UTF-8"?>
<First8>
<orderItem id="1-3389-0062-6"></orderItem>
</First8>
在Schema文档中采用一个attribute来定义:
First8.xsd
<xsd:element name="orderItem">
<xsd:complexType>
<xsd:sequence>
<!-- 空元素 -->
</xsd:sequence>
<!-- 定义该元素的属性 -->
<xsd:attribute name="id" type="xsd:string"></xsd:attribute>
</xsd:complexType>
</xsd:element>
实例文档中该属性值是必须的还是可有可无的呢?我们可以这样限制:
<xsd:attribute name=“id” type=“idType” use=“required”/>
这里我们讲id属性类型作为一种自定义数据类型idType。
而且,用attribute元素的use属性来定义是否是必须的属性。
required是必须值,optional是可选值,prohibited是无属性值。
那么对于属性的缺省值,我们怎么定义呢?
比如:
<?xml version="1.0" encoding="UTF-8"?>
<First8>
<orderItem id="1-3389-0062-6" quantity="3"></orderItem>
</First8>
我们还可以用attribute元素的另一个属性default来定义:
<xsd:attribute name=“quantity” type=“xsd:integer” default=“1”/>
所以,我们可以重新写出一个Schema文档:
<xsd:element name="orderItem">
<xsd:complexType>
<xsd:sequence>
<!-- 空元素 -->
</xsd:sequence>
<!-- 定义该元素的属性 -->
<xsd:attribute name="id" type="idType" use="required"></xsd:attribute>
<xsd:attribute name="quantity" type="xsd:integer" default="1"></xsd:attribute>
</xsd:complexType>
</xsd:element>
上面的属性我们定义我们还可以采用属性组的办法来重新改写Schema文档。
<?xml version="1.0" encoding="UTF-8"?>
<xsd:schema xmlns:xsd="http://www.w3.org/2001/XMLSchema">
<xsd:element name="orderItem">
<xsd:complexType>
<xsd:sequence>
<!-- 空元素 -->
</xsd:sequence>
<xsd:attributeGroup ref="orderItemAttributes" />
</xsd:element>
<xsd:attributeGroup name="orderItemAttributes">
<!-- 定义该元素的属性 -->
<xsd:attribute name="id" type="idType" use="required"></xsd:attribute>
<xsd:attribute name="quantity" type="xsd:integer"
default="1"></xsd:attribute>
</xsd:complexType>
</xsd:attributeGroup>
</xsd:schema>
<?xml version="1.0" encoding="UTF-8"?>
<xsd:schema xmlns:xsd="http://www.w3.org/2001/XMLSchema">
<xsd:element name="First8">
<xsd:complexType>
<xsd:sequence>
<xsd:element ref="orderItem" maxOccurs="10"></xsd:element>
</xsd:sequence>
</xsd:complexType>
</xsd:element>
<xsd:element name="orderItem">
<xsd:complexType>
<xsd:sequence>
<!-- 空元素 -->
</xsd:sequence>
<xsd:attributeGroup ref="orderItemAttributes" />
</xsd:complexType>
</xsd:element>
<xsd:attributeGroup name="orderItemAttributes">
<!-- 定义该元素的属性 -->
<xsd:attribute name="id" type="idType" use="required"></xsd:attribute>
<xsd:attribute name="quantity" type="xsd:integer"
default="1"></xsd:attribute>
</xsd:attributeGroup>
<xsd:simpleType name="idType">
<xsd:restriction base="xsd:string">
<xsd:pattern value="/d{1}-/d{4}-/d{4}-/d{1}"></xsd:pattern>
</xsd:restriction>
</xsd:simpleType>
</xsd:schema>
自己感觉:
XML Schema比XML DTD具有更强的表现力,特别是一些复杂的构造更加的好用些。
XML Schema虽然在大多数的应用领域都有替代XML DTD的趋势,但是XML DTD仍然有它的适用范围,并不可能被XML Schema完全替代