1.什么是xml
XML是指可扩展标记语言(eXtensible Markup Language),它是一种标记语言,很类似HTML。它被设计的宗旨是表示数据,而非显示数据。
XML标签没有被预定义,需要用户自行定义标签。
XML技术是W3C组织(World Wide Web Consortium万维网联盟)发布的,目前遵循的是W3C组织于2000年发布的XML1.0规范。
XML被广泛认为是继Java之后在Internet上最激动人心的新技术。
2.一个xml文件分为如下几部分
文档声明
在编写XML文档时,需要先使用文档声明来声明XML文档。且必须出现在文档的第一行。
最简单的语法:<?xml version=“1.0”?>
用encoding属性说明文档所使用的字符编码,默认为UTF-8。保存在磁盘上的文件编码要与声明的编码一致。
如:<?xml version=“1.0” encoding=“GB2312”?>
用standalone属性说明文档是否独立,即是否依赖其他文档。
如:<?xml version=“1.0” standalone=“yes”?>
常见的错误 标点符号中式的.
元素
XML元素指XML文件中出现的标签。一个标签分为起始和结束标签(不能省略)。一个标签有如下几种书写形式:
包含标签主体:<mytag>some content</mytag>
不含标签主体:<mytag/>
一个标签中可以嵌套若干子标签,但所有标签必须合理的嵌套,不允许有交叉嵌套。
<mytag1><mytag2></mytag1></mytag2> WRONG
一个XML文档必须有且仅有一个根标签,其他标签都是这个根标签的子标签或孙标签。
属性
一个标签可以有多个属性,每个属性都有它自己的名称和取值,例如:
<mytag name="value"/>
注释
Xml文件中的注释采用:<!--这是注释-->
CDATA区、特殊字符
<?xml version="1.0" encoding="UTF-8"?>
<中国>
<![CDATA[<北京>
<海定></海定>
<丰台></丰台>
</北京>]]>
<江西>
<南昌></南昌>
<上饶></上饶>
</江西>
</中国>
转义字符
特殊字符 替代字符
& &
< <
> >
" "
' '
处理指令
处理指令,简称PI(Processing Instruction)。
作用:用来指挥软件如何解析XML文档。
语法:必须以“<?”作为开头,以“?>”作为结尾。
常用处理指令:
XML声明:<?xml version=“1.0” encoding=“GB2312”?>
xml-stylesheet指令:
作用:指示XML文档所使用的CSS样式XSL。
如下
css文件
china{
font-size:300px;
color:red;
}
america{
font-size:50px;
color:blue;
}
japan{
font-size:10px;
color:green;
}
xml文件
<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/css" href="style.css"?>
<world>
<china>中国</china>
<america>鬼佬</america>
<japan>小日本</japan>
</world>
3.Java解析XML概述
XML解析方式分为两种:DOM方式和SAX方式
DOM:Document Object Model,文档对象模型。这种方式是W3C推荐的处理XML的一种方式。
SAX:Simple API for XML。这种方式不是官方标准,属于开源社区XML-DEV,几乎所有的XML解析器都支持它。
XML解析开发包
JAXP:是SUN公司推出的解析标准实现。
Dom4J:是开源组织推出的解析开发包。(牛,大家都在用,包括SUN公司的一些技术的实现都在用)
JDom:是开源组织推出的解析开发包。

被折叠的 条评论
为什么被折叠?



