Java解析XML

最新推荐文章于 2023-11-20 09:38:56 发布

原创最新推荐文章于 2023-11-20 09:38:56 发布 · 281 阅读

0 ·

CC 4.0 BY-SA版权

XML 专栏收录该内容

2 篇文章

订阅专栏

解析方式

1.SAX：逐行解析，只能查询。

2.DOM:一次性将文档加载到内容中，形成一个DOM树。可以对DOM树CURD操作。

解析技术

1.JAXP：sun公司提供支持DOM和SAX开发包。

2.JDom：和dom4j功能差不多，也是同一个团队开发的，只是后来，脱离公司，独立开发了。

3.jsoup：一种处理HTML特定解析开发包。

4.dom4j：比较常用的解析开发包，Hibernate底层采用。

dom4j解析

此篇主要以dom4j解析为例子。

使用步骤:
1.导入jar包
2.创建一个核心对象 SAXReader
new SAXReader();
3.将xml文档加载到内存中形成一棵树
Document doc=reader.read(文件)
4.获取根节点
Element root=doc.getRootElement();
5.通过根节点就可以获取其他节点(文本节点,属性节点,元素节点)
获取所有的子元素
List<Element> list=root.elements()
获取元素的指定属性内容
String value=root.attributeValue("属性名");
获取子标签标签体:遍历list 获取到每一个子元素
String text=ele.elementText("子标签名称")

dom4j案例

<?xml version="1.0" encoding="UTF-8"?>
<web-app version="2.5">
	<servlet>
		<servlet-name>HelloMyServlet</servlet-name>
		<servlet-class>com.itheima.HelloMyServlet</servlet-class>
	</servlet>
	<servlet-mapping>
		<servlet-name>HelloMyServlet</servlet-name>
		<url-pattern>/hello</url-pattern>
	</servlet-mapping>
</web-app>

public class Dom4jDemo {

	public static void main(String[] args) throws Exception {
		//创建核心对象
		SAXReader reader = new SAXReader();
		
		//获取dom树
		Document doc = reader.read("D:\\eclipsewk\\28\\day08\\xml\\web.xml");
		
		//获取根节点
		Element root=doc.getRootElement();
		
		//获取其他节点
		List<Element> list = root.elements();
		//遍历集合
		for (Element ele : list) {
			//获取servlet-name的标签体
			String text = ele.elementText("servlet-name");
			//System.out.println(text);
			
			//获取url-pattern标签体
			//System.out.println(ele.elementText("url-pattern"));
		}
		
		//获取root的version属性值
		String value = root.attributeValue("version");
		System.out.println(value);
	}
}

利用dom4j读取XML有个弊端，读取servlet-name节点，因为有两个同名节点，显示两次。读取url-pattern节点，因为一个节点有，一个节点没有，那么显示null和/hello。

xpath解析技术

xpath依赖于dom4j。xpath可以根据表达式直接定义到xml节点的位置

使用步骤:
1.导入jar包(dom4j和jaxen-1.1-beta-6.jar)
2.加载xml文件到内存中
3.使用api
selectNode("表达式");
selectSingleNode("表达式");
表达式的写法:
/ 从根节点选取
// 从匹配选择的当前节点选择文档中的节点，而不考虑它们的位置
例如一个标签下有一个id属性且有值 id=2;
//元素名[@属性名='属性值']
//元素名[@id='2']

package com.itheima.xpath;

import java.util.List;

import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;

public class XpathDemo {

	public static void main(String[] args) throws DocumentException {
		//加载dom树
		Document doc=new SAXReader().read("D:\\eclipsewk\\28\\day08\\xml\\web.xml");
		
		//获取节点
		//List<Element> list = doc.selectNodes("/web-app/servlet/servlet-name");--获取所有节点
		//Element ele = list.get(0);
		Element ele=(Element) doc.selectSingleNode("//servlet/servlet-name");--直接获取某一个节点的值
		System.out.println(ele.getText());
	}

}

更多的表达式写法，自行百度XPathTutorial.chm。

至于两个jar包对应的版本，以后补充。