Java解析XML

解析方式

1.SAX:逐行解析,只能查询。

2.DOM:一次性将文档加载到内容中,形成一个DOM树。可以对DOM树CURD操作。

解析技术

1.JAXP:sun公司提供支持DOM和SAX开发包。

2.JDom:和dom4j功能差不多,也是同一个团队开发的,只是后来,脱离公司,独立开发了。

3.jsoup:一种处理HTML特定解析开发包。

4.dom4j:比较常用的解析开发包,Hibernate底层采用。

dom4j解析

此篇主要以dom4j解析为例子。

使用步骤:
1.导入jar包
2.创建一个核心对象 SAXReader
new SAXReader();
3.将xml文档加载到内存中形成一棵树
Document doc=reader.read(文件)
4.获取根节点
Element root=doc.getRootElement();
5.通过根节点就可以获取其他节点(文本节点,属性节点,元素节点)
获取所有的子元素
List<Element> list=root.elements()
获取元素的指定属性内容
String value=root.attributeValue("属性名");
获取子标签标签体:遍历list 获取到每一个子元素
String text=ele.elementText("子标签名称")

dom4j案例

<?xml version="1.0" encoding="UTF-8"?>
<web-app version="2.5">
	<servlet>
		<servlet-name>HelloMyServlet</servlet-name>
		<servlet-class>com.itheima.HelloMyServlet</servlet-class>
	</servlet>
	<servlet-mapping>
		<servlet-name>HelloMyServlet</servlet-name>
		<url-pattern>/hello</url-pattern>
	</servlet-mapping>
</web-app>

public class Dom4jDemo {

	public static void main(String[] args) throws Exception {
		//创建核心对象
		SAXReader reader = new SAXReader();
		
		//获取dom树
		Document doc = reader.read("D:\\eclipsewk\\28\\day08\\xml\\web.xml");
		
		//获取根节点
		Element root=doc.getRootElement();
		
		//获取其他节点
		List<Element> list = root.elements();
		//遍历集合
		for (Element ele : list) {
			//获取servlet-name的标签体
			String text = ele.elementText("servlet-name");
			//System.out.println(text);
			
			//获取url-pattern标签体
			//System.out.println(ele.elementText("url-pattern"));
		}
		
		//获取root的version属性值
		String value = root.attributeValue("version");
		System.out.println(value);
	}
}

利用dom4j读取XML有个弊端,读取servlet-name节点,因为有两个同名节点,显示两次。读取url-pattern节点,因为一个节点有,一个节点没有,那么显示null和/hello。

xpath解析技术

xpath依赖于dom4j。xpath可以根据表达式直接定义到xml节点的位置

使用步骤:
1.导入jar包(dom4j和jaxen-1.1-beta-6.jar)
2.加载xml文件到内存中
3.使用api
selectNode("表达式");
selectSingleNode("表达式");
表达式的写法:
/ 从根节点选取 
// 从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置 
例如一个标签下有一个id属性且有值  id=2;
//元素名[@属性名='属性值']
//元素名[@id='2']

package com.itheima.xpath;

import java.util.List;

import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;

public class XpathDemo {

	public static void main(String[] args) throws DocumentException {
		//加载dom树
		Document doc=new SAXReader().read("D:\\eclipsewk\\28\\day08\\xml\\web.xml");
		
		//获取节点
		//List<Element> list = doc.selectNodes("/web-app/servlet/servlet-name");--获取所有节点
		//Element ele = list.get(0);
		Element ele=(Element) doc.selectSingleNode("//servlet/servlet-name");--直接获取某一个节点的值
		System.out.println(ele.getText());
	}

}

更多的表达式写法,自行百度XPathTutorial.chm。

至于两个jar包对应的版本,以后补充。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值