Dom方式解析XML详解
原文 http://blog.youkuaiyun.com/mytroy/article/details/39895351
一、Dom解析XML原理
Dom解析方式是把整个XML文件读入内存生成一个Document(org.w3c.dom.Document)对象代表整个XML文件,再把每一个标签解析成相应的对象并生成一棵DOM树,对XML文件的增删查改操作转化为增删查改DOM树中的节点。
优点:对XML文件的CRUD操作很方便
缺点:占用内存大
开发包: Jaxp(sun公司)
二、Dom解析步骤
1. 获取XML文件对应的Document对象
2. 通过Document对象对内存中的树进行CRUD操作
a. 获取某个特定的节点对象
b. 对该节点采取一列的操作
3. 将内存中的树转化到文件系统储存
样本XML如下(#1):
<?xml version="1.0" encoding="UTF-8" ?> <BookDesk> <Book> <name source='www.baidu.com'>Thinking in C++</name> <price>100</price> <author>Acpp</author> </Book> <Book> <name>Java Writing</name> <price>30</price> <author>AJAVA</author> </Book> </BookDesk>
三、通过Jaxp API获取Document对象
File xmlFile = new File(filePath);
//XML解析器工厂调用静态方法生成一个XML解析器工厂对象
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
// XML解析器工厂对象调用静态方法生成一个 XML解析器对象
DocumentBuilder builder = factory.newDocumentBuilder();
// XML解析器对象解析XML文件返回内存中代表XML文件的 Document 对象
Document document = builder.parse(xmlFile);
四、查找XML中某个节点
//查找所有标签名字为“ Book”节点, NodeList对象保留了名字为 “ Book ”节点出现的顺序
NodeList list = document.getElementsByTagName(" Book");
//获取索引为index的节点对象
Node node = list.item(index(int));
//强制将Node 转化为 Element
Element element = ( Element )node;
注: document可以看成成是一棵树, document.getDocumentElement()方法即可直接获得这棵树的根节点。每个节点也可使用 getElementsByTagName("name")方法查找该节点内部子节点名字为name的标签。
五、对节点进行修改和跟新操作
Element继承Node类,即Element是Node的扩展,可用的方法更多。当某个功能Node类不能实现时,可以将Node强制转换成Element去实现该功能,例如:Node的类不能直接获取标签的属性,更不能去增加和更改一个标签的属性,但是Element可以。
//Node操作举例
node.getNodeName();
node.getParentNode();
node.getTextContent();
// Element操作举例
element.getAttribute("属性名");
element.setAttribute("属性名", "属性值");
element.removeAttribute("属性名");
六、向XML中增加节点
1. 创建节点
Element newElement = document.createElement("price");
newElement.setTextContent("500");
2. 找到需要挂载节点的目标节点
NodeList list = document.getElementsByTagName("Book");
Element element = (Element) list.item(0);
3. 将节点挂载到目标节点的子节点的末尾
element.appendChild(newElement);
注:element.insertBefore(Node newChild, Node refChild); 可将节点指定插入到参照节点 refChild之前。
4. 保存:将内存中的DOM树保存到持久化设备
样本XML(#1)运行增加节点方法后如下(#2):
<?xml version="1.0" encoding="UTF-8" standalone="no"?> <BookDesk> <Book> <name source="WWWXXX">Thinking in C++</name> <price>100</price> <author>Acpp</author> <price>500</price> </Book> <Book> <name>Java Writing</name> <price>30</price> <author>AJAVA</author> </Book> </BookDesk>
七、从XML中删除节点
1. 找到要删除的节点
Element element = (Element) document.getElementsByTagName("price").item(1);
2. 删除该节点
//方法1:
//直接通过该节点得到父节点然后再删除该节点
element.getParentNode().removeChild(element);
//方法2:
//通过document得到父节点,再删除该节点
Node node = document.getElementsByTagName("Book").item(0);
node.removeChild(element);
3. 保存:将内存中的XML树保存到持久化设备
XML样本 (#2) 运行从XML删除节点方法后又得到XML样本(#1)。
八、将内存中的DOM树保存到持久化设备
javax.xml.transform包中Transformer类用于把内存中代表XML的Document对象转化为某种格式后输出。
//获取 Transformer工厂对象,在通过该对象获取 Transformer对象
TransformerFactory factory = TransformerFactory.newInstance();
Transformer transformer = factory.newTransformer();
// transform. transform方法转换格式并输出
transformer.transform(Source xmlSource, Result outputTarget);
// xmlSource: Document对象;new DOMSource(document)
// outputTarget:输出目标;new StreamResult(文件输出流或File对象)
//转换document对象,保存到持久化设备
transformer.transform(new DOMSource(document), new StreamResult(xmFile));