Dom方式解析XML详解

Dom方式解析XML详解

原文   http://blog.youkuaiyun.com/mytroy/article/details/39895351

 

一、Dom解析XML原理

Dom解析方式是把整个XML文件读入内存生成一个Document(org.w3c.dom.Document)对象代表整个XML文件,再把每一个标签解析成相应的对象并生成一棵DOM树,对XML文件的增删查改操作转化为增删查改DOM树中的节点。

优点:对XML文件的CRUD操作很方便

缺点:占用内存大

开发包: Jaxp(sun公司)


二、Dom解析步骤

1. 获取XML文件对应的Document对象

2. 通过Document对象对内存中的树进行CRUD操作

a.  获取某个特定的节点对象

b. 对该节点采取一列的操作

3. 将内存中的树转化到文件系统储存

样本XML如下(#1):

 

<?xml version="1.0" encoding="UTF-8" ?> 

<BookDesk> 
        <Book> 
                <name source='www.baidu.com'>Thinking in C++</name> 
                <price>100</price> 
                <author>Acpp</author> 
        </Book> 
        <Book> 
                <name>Java Writing</name> 
                <price>30</price> 
                <author>AJAVA</author> 
        </Book> 
</BookDesk>

 

 

 

三、通过Jaxp API获取Document对象

File xmlFile = new File(filePath);

//XML解析器工厂调用静态方法生成一个XML解析器工厂对象

DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();

// XML解析器工厂对象调用静态方法生成一个 XML解析器对象

DocumentBuilder builder = factory.newDocumentBuilder();

// XML解析器对象解析XML文件返回内存中代表XML文件的 Document 对象

Document document = builder.parse(xmlFile);

 

四、查找XML中某个节点

//查找所有标签名字为“ Book”节点, NodeList对象保留了名字为 “ Book ”节点出现的顺序

NodeList list = document.getElementsByTagName(" Book");

//获取索引为index的节点对象

Node node = list.item(index(int));

//强制将Node 转化为 Element  

Element element = ( Element )node;

注: document可以看成成是一棵树, document.getDocumentElement()方法即可直接获得这棵树的根节点。每个节点也可使用 getElementsByTagName("name")方法查找该节点内部子节点名字为name的标签。

 

五、对节点进行修改和跟新操作

Element继承Node类,即Element是Node的扩展,可用的方法更多。当某个功能Node类不能实现时,可以将Node强制转换成Element去实现该功能,例如:Node的类不能直接获取标签的属性,更不能去增加和更改一个标签的属性,但是Element可以。

//Node操作举例

node.getNodeName();

node.getParentNode();

node.getTextContent();

// Element操作举例

element.getAttribute("属性名");

element.setAttribute("属性名", "属性值");

element.removeAttribute("属性名");

 

六、向XML中增加节点

1. 创建节点

Element newElement = document.createElement("price");

newElement.setTextContent("500");

2. 找到需要挂载节点的目标节点

NodeList list = document.getElementsByTagName("Book");

Element element = (Element) list.item(0);

3. 将节点挂载到目标节点的子节点的末尾

element.appendChild(newElement);

注:element.insertBefore(Node newChild, Node refChild);  可将节点指定插入到参照节点 refChild之前。

4. 保存:将内存中的DOM树保存到持久化设备

样本XML(#1)运行增加节点方法后如下(#2):

<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<BookDesk>
        <Book>
                <name source="WWWXXX">Thinking in C++</name> 
                <price>100</price> 
                <author>Acpp</author> 
                <price>500</price> 
        </Book>
         <Book>
                <name>Java Writing</name> 
                <price>30</price> 
                <author>AJAVA</author> 
        </Book>
</BookDesk>

 

 

七、从XML中删除节点

1. 找到要删除的节点

Element element = (Element) document.getElementsByTagName("price").item(1);

2. 删除该节点

//方法1:

//直接通过该节点得到父节点然后再删除该节点

element.getParentNode().removeChild(element);

//方法2:

//通过document得到父节点,再删除该节点

Node node = document.getElementsByTagName("Book").item(0);

node.removeChild(element);

3.  保存:将内存中的XML树保存到持久化设备

XML样本 (#2) 运行从XML删除节点方法后又得到XML样本(#1)。

 

八、将内存中的DOM树保存到持久化设备

javax.xml.transform包中Transformer类用于把内存中代表XML的Document对象转化为某种格式后输出。

//获取 Transformer工厂对象,在通过该对象获取 Transformer对象

TransformerFactory factory = TransformerFactory.newInstance();

Transformer transformer = factory.newTransformer();

// transform. transform方法转换格式并输出

transformer.transform(Source xmlSource, Result outputTarget);

// xmlSource: Document对象;new DOMSource(document)

// outputTarget:输出目标;new StreamResult(文件输出流或File对象)

//转换document对象,保存到持久化设备

transformer.transform(new DOMSource(document), new StreamResult(xmFile));

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值