xml的简介
eXtensible Markup Language:可扩展标记型语言
html是标记型语言,都是使用标签来操作
可扩展:
-html里面的标签都是固定的,每个标签都有特定的含义
-xml标签可以自己定义,可以写中文的标签
xml的用途
html是用于显示数据,xml也可以显示数据,但主要功能是为了存储数据
xml的应用
1.用于系统之间数据的传输
2.用于表示生活中有关系的数据
3.作为配置文件
xml的语法
1.xml的文档声明
1.创建一个文件,后缀名是 .xml
2.第一步要有一个文档声明
格式:<?xml version=”1.0” encoding=”gbk”?> 版本(1.0)编码样式(保存和打开的编码要一致)
文档声明必须写在第一行第一列(前面不能有空格、空行及注释)
3.属性:
version:xml的版本 1.0(使用) 1.1
encoding:xml的编码 gbk utf-8
standing:说明文档是否依赖其他文件 yes/no
2.定义元素(标签)
1.一个xml中有且只有一个根标签,可以自定义
2.在xml中空格和换行都当成内容来解析,所以书写要注意紧凑
3.标签的命名规则:
1.区分大小写,可以是中文
2.不能以数字和下划线开头
3.不能以 xml 开头(大写也不行
4.不能包含空格和冒号
3.定义属性
1.一个标签上可以有多个属性
2.属性名称不能相同
3.属性的命名规范和元素的命名规范相同
4.注释
5.特殊字符
6.CDATA区
<![CDATA[ 内容 ]]>把内容当成文本输出,遇到特殊字数也当成文本
7.PI指令
可以在xml中设置样式,但一般用不到,因为xml多为存储数据
写法:<?xml-stylesheet href=”css的路径”?>
注意:只能对英文标签名称起作用,对中文标签名称不起作用
语法总结
*所有XML元素都必须有关闭标签
*XML必须正确地嵌套顺序
*XML文档必须有根元素(只有一个)
*XML的属性值需加引号
*特殊字符必须转义----CDATA
*XML中的空格、回车换行会在解析时保留
8.XML的约束
在XML技术里,可以编写一个文档来约束一个XML文档的书写规范,这称之为XML约束。
常用的约束技术有:dtd约束 schema约束
9.dtd的快速入门
*创建一个文件,后缀名 .dtd
步骤:
1.看xml中有多少个元素,有几个,就在dtd文件中写几个<!ELEMENT>
2.判断元素是简单元素还是复杂元素
复杂元素:有子元素的元素
<!ELEMENT 元素名称(子元素,子元素...)>
简单元素:没有子元素的元素
<!ELEMENT 元素名称(#PCDTD)>
3.需要在xml文件引入dtd文件
<!DOCTYPE 根元素名称 SYSTEM “dtd文件的路径”>
校验xml语法可以使用浏览器,校验dtd约束语法需要使用myeclipse
10.dtd的三种引入方式
1.引入外部的dtd文件
<!DOCTYPE 根元素名称 SYSTEM “dtd文件的路径”>
2.使用内部的dtd文件
<!DOCTYPE 根元素名称 [ 内容 ]>
3.使用外部的dtd文件(网络上的dtd文件)
<!DOCTYPE 根元素名称 PUBLIC “DTD名称” “DTD文档的URL”>
11.使用dtd定义元素
语法:<! ELEMENT 元素名 约束>
简单元素:没有子元素的元素
<!ELEMENT 元素名称(#PCDTD)>
---->(#PCDATA):约束元素是字符串类型
---->EMPTY:元素为空(没有内容)
---->ANY:任意
复杂元素:有子元素的元素
<!ELEMENT 元素名称(子元素,子元素...)>
---->默认子元素只能出现一次
----> 元素+:表示元素可以出现一次或多次
----> 元素?:表示元素可以出现零次或一次
----> 元素*:表示元素可以出现零次或多次
注意:子元素使用逗号隔开,表示元素出现的顺序(子元素要按顺序出现)
子元素用丨隔开,表示元素只能出现其中的任意一个
12.使用dtd定义属性
语法:<!ATTLIST 元素名 属性名 属性类型 属性的约束>
属性的类型:
--CDATA:字符串
--(aa|bb|cc):枚举:表示只能在一定的范围内出现值,但是每次只能出现其中的一个
**红绿灯效果 (aa|bb|cc)
--ID:值只能是字母或者下划线开头
属性的约束:
--#REQUIRED:表示属性必须存在
--#IMPLIED:表示属性可有可无
--#FIXED:表示一个固定值:#FIXES “AAA”
--#直接值:元素不写属性,使用直接值(相当于默认值)
13.实体的定义
语法:<!ENTITY 实体名称 “实体的值”>
<!ENTITY TEST “HAHA”>
使用实体: &实体名称; 如: &TEST;
14.xml的解析(用到java代码)
xml的解析方式(技术):dom 和 sax
想要解析xml,首先需要解析器
不同公司和组织针对dom 和 sax 提供了解析器,通过api方式提供
sun 公司----jaxp dom4j组织----dom4j (***实际开发中***)
xml是标记型性文档,js使用dom解析标记型文档
dom方式解析:
--根据html的层级结构,在内存中分配一个树形结构,把html的标签,属性和文本都封装成对象
--document对象、element对象、属性对象、文本对象、Node节点对象
--缺点:如果文件过大,造成内存溢出
--优点:很方便实现增删改操作
sax方式解析:
--采用时间驱动,边读边解析
--从上到下,一行一行的解析,解析到某一个对象,返回对象名称
--缺点:不能实现增删改操作
--优点:如果文件过大,不会造成内存溢出,方便实现查询操作
schema约束
1、XML Schema 是用于定义和描述 XML 文档结构与内容的模式语言,其出现目的是为了克服 DTD 的局限性
2、XML Schema 与 DTD比较:
⑴XML Schema符合XML语法结构。
⑵DOM、SAX等XML API很容易解析出XML Schema文档中的内容。
⑶XML Schema对名称空间支持得非常好。
⑷XML Schema比XML DTD支持更多的数据类型,并支持用户自定义新的数据类型。
⑸XML Schema定义约束的能力非常强大,可以对XML实例文档作出细致的语义限制。
⑹XML Schema不能像DTD一样定义实体,比DTD更复杂,但Xml Schema现在已是w3c组织的标准,它正逐步取代DTD。
3、XML Schema 文件自身就是一个XML文件,但它的扩展名通常为.xsd。
4、一个XML Schema文档通常称之为模式文档(约束文档),遵循这个文档书写的xml文件称之为实例文档。
5、和XML文件一样,一个XML Schema文档也必须有一个根结点,但这个根结点的名称为Schema。
6、编写了一个XML Schema约束文档后,通常需要把这个文件中声明的元素绑定到一个URI地址上,即把XML Schema文档声明的元素绑定到一个名称空间上,以后XML文件就可以通过这个URI(即名称空间)来告诉解析引擎,xml文档中编写的元素来自哪里,被谁约束。
代码说明:
//模式文档(约束文档):
<?xml version="1.0" encoding="UTF-8" ?>
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema"
targetNamespace="http://www. itcast.cn"
elementFormDefault="qualified">
<xs:element name='书架' >
<xs:complexType>
<xs:sequence maxOccurs='unbounded' >
<xs:element name='书' >
<xs:complexType>
<xs:sequence>
<xs:element name='书名' type='xs:string' />
<xs:element name='作者' type='xs:string' />
<xs:element name='售价' type='xs:string' />
</xs:sequence>
</xs:complexType>
</xs:element>
</xs:sequence>
</xs:complexType>
</xs:element>
</xs:schema>
//实例文档:
<?xml version="1.0" encoding="UTF-8"?>
<itcast:书架 xmlns:itcast="http://www.itcast.cn"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation=“http://www.itcast.cn book.xsd">
<itcast:书>
<itcast:书名>JavaScript网页开发</itcast:书名>
<itcast:作者>redarmy</itcast:作者>
<itcast:售价>28.00元</itcast:售价>
</itcast:书>
</itcast:书架>
7、在XML Schema中,每个约束模式文档都可以被赋以一个唯一的名称空间,名称空间用一个唯一的URI(Uniform Resource Identifier,统一资源标识符)表示。 在Xml文件中书写标签时,可以通过名称空间声明(xmlns),来声明当前编写的标签来自哪个Schema约束文档。
例子:
<csdn:书架 xmlns:csdn=“http://www.youkuaiyun.com”>
<itcast:书>……</itcast:书>
</csdn:书架>
此处使用csdn来指向声明的名称,以便于后面对名称空间的引用。
注意:名称空间的名字语法容易让人混淆,尽管以 http:// 开始,那个 URL 并不指向一个包含模式定义的文件。事实上,这个 URL:http://www.youkuaiyun.com根本没有指向任何文件,只是一个分配的名字。
8、使用名称空间引入Schema
为了在一个XML文档中声明它所遵循的Schema文件的具体位置,通常需要在Xml文档中的根结点中使用schemaLocation属性来指定
<itcast:书架 xmlns:itcast="http://www.itcast.cn"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation=”http://www.itcast.cn book.xsd">
schemaLocation此属性有两个值。第一个值是需要使用的命名空间。第二个值是供命名空间使用的 XML schema 的位置,两者之间用空格分隔。
注意,在使用schemaLocation属性时,也需要指定该属性来自哪里。
9、使用默认名称空间
基本格式:xmlns="URI"
例:
<书架 xmlns="http://www.it315.org/xmlbook/schema"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation=“http://www.itcast.cn book.xsd">
10、使用名称空间引入多个XML Schema文档
例:
<?xml version="1.0" encoding="UTF-8"?>
<书架 xmlns="http://www.it315.org/xmlbook/schema"
xmlns:demo="http://www.it315.org/demo/schema"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.it315.org/xmlbook/schema http://www.it315.org/xmlbook.xsd
http://www.it315.org/demo/schema http://www.it315.org/demo.xsd">
11、不使用空间引入XML Schema文档
<?xml version="1.0" encoding="UTF-8"?>
<书架 xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:noNamespaceSchemaLocation="xmlbook.xsd">
这个例子中的元素就不属于任何名称空间,但是这些词汇来自xmlbook.xsd模式文档,就可以通过noNamespaceSchemaLocation属性来指定。
12.在XML Schema文档中声明名称空间
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema"
targetNamespace="http://www. itcast.cn"
elementFormDefault="qualified">
<xs:schema>
(1)targetNamespace元素用于指定schema文档中声明的元素属于哪个名称空间。
(2)mentFormDefault元素用于指定schema文档中声明的根元素及其所有子元素都属于targetNamespace所指定的名称空间