【XML基础】

1 XML入门

1.1 引入

HTML: 负责网页的结构
CSS: 负责网页的样式(美观)
Javascript: 负责在浏览器端与用户进行交互。

负责静态的网页制作的语言

HTML语言特点:

1)由标签组成。 <title> <p> <hr/> <br/>
2)语法结构松散的 <p></p> <p> <P>
3) 大小写不区分
4) 结束标签和开始标签不一定匹配

<html>
	<head>
		<title>this is title</title>
	</head>
	<body>
		<p>html标签</p>
		<P>html标签</P>
		<abc>abc标签</abc>  自定义标签
	</body>
</html>

这种自定义标签可以把他们叫做xml标签。

1.2 HTML和XML的区别

HTML XML
名称HyperText Markup Languae(超文本标记语言)Extend Markup Languge(可扩展标签语言)
标签标签是w3c组成指定,固定的,约100来个标签由开发者自己制定的(要按照一定的语法定义)
作用负责网页的结构1)描述带关系的数据(作为软件的配置文件): 包含与被包含的关系
2)作为数据的载体(存储数据,小型的“数据库”)

2 XML作用

2.1 描述带关系的数据(软件的配置文件)

把ip地址端口配置到xml文件:
host.xml

<host>
	<ip>255.43.12.55</ip>
	<port>1521</port>
</host>

2.2 数据的载体(小型的“数据库”)

teacher.xml

<teacher>	
		<name>张三</name>
		<email>zhangsan@qq.com</email>
		<workage>2</workage>
</teacher>

3 XML语法

xml文件以xml后缀名结尾。
xml文件需要使用xml解析器去解析。浏览器内置了xml解析器。

3.1 标签

语法: 开始标签 标签体内容 结束标签
1) 或 空标签。没有标签体内容
2)xml标签名称区分大小写。
3)xml标签一定要正确配对。
4)xml标签名中间不能使用空格
5)xml标签名不能以数字开头
6)注意: 在一个xml文档中,有且仅有一个根标签

3.2 属性

语法: <Student name="eric">student</Student>
注意:
1)属性值必须以引号包含,不能省略,也不能单双引号混用!!!
2)一个标签内可以有多个属性,但不能出现重复的属性名!!!

3.3 注释

语言:<!-- xml注释 -->

3.4 文档声明

语法: <?xml version="1.0" encoding="utf-8"?>
version: xml的版本号
encoding: 解析xml文件时查询的码表(解码过程时查询的码表)
注意:
1)如果在ecplise工具中开发xml文件,保存xml文件时自动按照文档声明的encoding来保存文件。
2)如果用记事本工具修改xml文件,注意保存xml文件按照文档声明的encoding的码表来保存。

3.5 转义字符

在xml中内置了一些特殊字符,这些特殊字符不能直接被浏览器原样输出。如果希望把这些特殊字符按照原样输出到浏览器,对这些特殊字符进行转义。转义之后的字符就叫转义字节。

特殊字符 转义字符

<         &lt;
>         &gt;
"         &quot;
&         &amp;
空格      &nsbp;

3.6 CDATA块

作用: 可以让一些需要进行包含特殊字符的内容统一进行原样输出。

3.7 处理指令

作用: 告诉xml解析如果解析xml文档

案例: <?xml-stylesheet type="text/css" href="1.css"?> 告诉xml解析该xml文档引用了哪个css文件
需要提前xml内容可以使用xml-stylesheet指令指令

4 XML解析

4.1 引入

xml文件除了给开发者看,更多的情况使用程序读取xml文件的内容。这叫做xml解析

4.2 XML解析方式(原理不同)

DOM解析
SAX解析

4.3 XML解析工具

DOM解析原理:
1)JAXP (oracle-Sun公司官方)
2)JDOM工具(非官方)
3)Dom4J工具(非官方)
三大框架(默认读取xml的工具就是Dom4j)

SAX解析原理:
1)Sax解析工具(oracle-sun公司官方)

4.4 什么是DOM解析

DOM解析原理:xml解析器一次性把整个xml文档加载进内存,然后在内存中构建一颗Document的对象树,通过Document对象,得到树上的节点对象,通过节点对象访问(操作)到xml文档的内容。

4.5 Dom4j工具

非官方,不在jdk中。

使用步骤:
1)导入dom4j的核心包。 dom4j-1.6.1.jar
2)编写Dom4j读取xml文件代码

public static void main(String[] args) {
	try {
		//1.创建一个xml解析器对象
		SAXReader reader = new SAXReader();
		//2.读取xml文档,返回Document对象
		Document doc = reader.read(new File("./src/contact.xml"));
		System.out.println(doc);
	} catch (DocumentException e) {
		e.printStackTrace();
		throw new RuntimeException(e);
	}
}

4.6 Domj4读取xml文件

节点:
Iterator Element.nodeIterator(); //获取当前标签节点下的所有子节点
标签:
Element Document.getRootElement(); //获取xml文档的根标签
Element ELement.element("标签名") //指定名称的第一个子标签
Iterator Element.elementIterator(“标签名”);// 指定名称的所有子标签
List<Element> Element.elements();//获取所有子标签
属性:
String Element.attributeValue("属性名") //获取指定名称的属性值
Attribute Element.attribute("属性名");//获取指定名称的属性对象
Attribute.getName() //获取属性名称
Attibute.getValue() //获取属性值
List<Attribute> Element.attributes(); //获取所有属性对象
Iterator<Attribute> Element.attibuteIterator();//获取所有属性对象

文本:
Element.getText(); //获取当前标签的文本
Element.elementText("标签名")//获取当前标签的指定名称的子标签的文本内容

总结:
1)XML的作用
配置文件(最常见)
作为数据库
2)XML语法
3)XML解析(DOM解析)
3.1 DOM解析原理
3.2 Dom4j工具(基于DOM解析)
读取:
节点
标签节点
属性节点
文本节点

5 Dom4j修改xml文档

5.1 写出内容到xml文档

XMLWriter writer = new XMLWriter(OutputStream, OutputForamt)
wirter.write(Document);

5.2 修改xml文档的API

增加:
DocumentHelper.createDocument() 增加文档
addElement("名称") 增加标签
addAttribute("名称",“值”) 增加属性
修改:
Attribute.setValue("值") 修改属性值
Element.addAtribute("同名的属性名","值") 修改同名的属性值
Element.setText("内容") 修改文本内容
删除
Element.detach(); 删除标签
Attribute.detach(); 删除属性

6 xPath技术

6.1 引入

问题:当使用dom4j查询比较深的层次结构的节点(标签,属性,文本),比较麻烦!!!

6.2 xPath作用

主要是用于快速获取所需的节点对象。

6.3 在dom4j中如何使用xPath技术

1)导入xPath支持jar包 。jaxen-1.1-beta-6.jar
2)使用xpath方法
List<Node> selectNodes("xpath表达式"); 查询多个节点对象
Node selectSingleNode("xpath表达式"); 查询一个节点对象

6.4 xPath语法

/      绝对路径      表示从xml的根位置开始或子元素(一个层次结构)
//     相对路径      表示不分任何层次结构的选择元素。
*      通配符        表示匹配所有元素
[]      条件         表示选择什么条件下的元素
@       属性         表示选择属性节点
and     关系         表示条件的与关系(等价于&&)
text()  文本         表示选择文本内容

7 SAX解析

7.1回顾DOM解析

DOM解析原理:一次性把xml文档加载进内存,然后在内存中构建Document树。
对内存要求比较要。
缺点: 不适合读取大容量的xml文件,容易导致内存溢出。

SAX解析原理: 加载一点,读取一点,处理一点。对内存要求比较低。

7.2 SAX解析工具

SAX解析工具- Sun公司提供的。内置在jdk中。org.xml.sax.*

核心的API:
SAXParser类: 用于读取和解析xml文件对象
parse(File f, DefaultHandler dh)方法: 解析xml文件

参数一: File:表示 读取的xml文件。
参数二: DefaultHandler: SAX事件处理程序。使用DefaultHandler的子类
例如:

//1.创建SAXParser对象  
	SAXParser parser=SAXParserFactory.newInstance().newSAXParser();
	//2.调用parse方法
	parser.parse(new File("./src/contact.xml"), new MyDefaultHandler());[一个类继承class 类名(extends DefaultHandler)  在调用是创建传进去

DefaultHandler类的API:
void startDocument() : 在读到文档开始时调用
void endDocument() :在读到文档结束时调用
void startElement(String uri, String localName, String qName, Attributes attributes) :读到开始标签时调用
void endElement(String uri, String localName, String qName) :读到结束标签时调用
void characters(char[] ch, int start, int length) : 读到文本内容时调用

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值