解析方式
1.SAX:逐行解析,只能查询。
2.DOM:一次性将文档加载到内容中,形成一个DOM树。可以对DOM树CURD操作。
解析技术
1.JAXP:sun公司提供支持DOM和SAX开发包。
2.JDom:和dom4j功能差不多,也是同一个团队开发的,只是后来,脱离公司,独立开发了。
3.jsoup:一种处理HTML特定解析开发包。
4.dom4j:比较常用的解析开发包,Hibernate底层采用。
dom4j解析
此篇主要以dom4j解析为例子。
使用步骤:
1.导入jar包
2.创建一个核心对象 SAXReader
new SAXReader();
3.将xml文档加载到内存中形成一棵树
Document doc=reader.read(文件)
4.获取根节点
Element root=doc.getRootElement();
5.通过根节点就可以获取其他节点(文本节点,属性节点,元素节点)
获取所有的子元素
List<Element> list=root.elements()
获取元素的指定属性内容
String value=root.attributeValue("属性名");
获取子标签标签体:遍历list 获取到每一个子元素
String text=ele.elementText("子标签名称")
dom4j案例
<?xml version="1.0" encoding="UTF-8"?>
<web-app version="2.5">
<servlet>
<servlet-name>HelloMyServlet</servlet-name>
<servlet-class>com.itheima.HelloMyServlet</servlet-class>
</servlet>
<servlet-mapping>
<servlet-name>HelloMyServlet</servlet-name>
<url-pattern>/hello</url-pattern>
</servlet-mapping>
</web-app>
public class Dom4jDemo {
public static void main(String[] args) throws Exception {
//创建核心对象
SAXReader reader = new SAXReader();
//获取dom树
Document doc = reader.read("D:\\eclipsewk\\28\\day08\\xml\\web.xml");
//获取根节点
Element root=doc.getRootElement();
//获取其他节点
List<Element> list = root.elements();
//遍历集合
for (Element ele : list) {
//获取servlet-name的标签体
String text = ele.elementText("servlet-name");
//System.out.println(text);
//获取url-pattern标签体
//System.out.println(ele.elementText("url-pattern"));
}
//获取root的version属性值
String value = root.attributeValue("version");
System.out.println(value);
}
}
利用dom4j读取XML有个弊端,读取servlet-name节点,因为有两个同名节点,显示两次。读取url-pattern节点,因为一个节点有,一个节点没有,那么显示null和/hello。
xpath解析技术
xpath依赖于dom4j。xpath可以根据表达式直接定义到xml节点的位置
使用步骤:
1.导入jar包(dom4j和jaxen-1.1-beta-6.jar)
2.加载xml文件到内存中
3.使用api
selectNode("表达式");
selectSingleNode("表达式");
表达式的写法:
/ 从根节点选取
// 从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置
例如一个标签下有一个id属性且有值 id=2;
//元素名[@属性名='属性值']
//元素名[@id='2']
package com.itheima.xpath;
import java.util.List;
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;
public class XpathDemo {
public static void main(String[] args) throws DocumentException {
//加载dom树
Document doc=new SAXReader().read("D:\\eclipsewk\\28\\day08\\xml\\web.xml");
//获取节点
//List<Element> list = doc.selectNodes("/web-app/servlet/servlet-name");--获取所有节点
//Element ele = list.get(0);
Element ele=(Element) doc.selectSingleNode("//servlet/servlet-name");--直接获取某一个节点的值
System.out.println(ele.getText());
}
}
更多的表达式写法,自行百度XPathTutorial.chm。
至于两个jar包对应的版本,以后补充。