XML解析

本文介绍XML解析的两种标准Sax和DOM,对比它们的优缺点,并详细解释如何使用Java编写程序完成XML文档的解析,包括DOM解析器的具体实现步骤及示例代码。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

XML解析

对XML解析的标准有两种:Sax和dom

       首先是两种标准并不是针对Java的,他们在各种语言环境下都可以实现

dom:DocumentObject Model, 即文档对象模型) 是 W3C 组织推荐的处理 XML 的一种方式,dom是真正的国际标准。

sax:(Simple API for XML) 不是官方标准,是事实的标准,几乎所有的 XML 解析器都支持它。他不由任何商业组织维护,而是由一个非商业的组织在运作。就像iso7层模型和tcp/ip一样,虽然sax不是正式的标准,但是一点不影响他在xml解析领域的地位。

Dom实现的原理是把整个xml文档一次性读出,放在一个树型结构里。在需要的时候,查找特定节点,然后对节点进行读或写。它的主要优势是实现简单,读写平衡;缺点是比较占内存,因为他要把整个xml文档都读入内存,文件越大,这种缺点就越明显。

sax的实现方法和dom不同。他只在xml文档中查找特定条件的内容,并且只提取需要的内容。这样做占用内存小,灵活,正好满足我们的需求。他的缺点就是写,有些资料介绍了写入的方法,但是我感觉这对本例没有必要。后面主要讲解用sax2.0实现xml文档解析。

XML解析器有三种:

       Crimson(SUN)、Xerces(Apache)、Aelfred2(dom4j)

       开发工具包:jaxp、jdom、dom4j

Jaxp开发包是J2SE的一部分,它是由

编写Java程序完成xml文档的解析:

       DOM解析器

       Public class DomTest{

              public static void main(String[]atgs){

                     //第一步生成工厂类对象

                     DocumentBuilderFactoryfactory=DocumentBuilderFactory.NewInstance();

              //第二步声称解析器对象

       DocumentBuilderbd=factory.newDocumentBuilder();

              //第三步对xml文档进行解析

       Document doc=bd.parse(new File(“文件的URL地址”))

              //第四部读取book.xml文档中到底有几个节点?节点的名称、节点的类型以及节点的值。

              System.out.println(doc.getChildNodes().getLength());

              Noderoot=doc.getChildNodes().item(0);

       System.out.println(root.getNodeName()+”  ”+root.getNodeTyoe()+”  ”+root.getNodeValue());

}

}

更新xml文档

       Javax.xml.transform包中的Transformer类用于把代表XML文件的Document对象转换为某种格式后进行输出。

       Transformer类通过Transform方法完成转换操作,该方法接收一个源和一个目的地。我们可以通过:

       javax.xml.transform.dom.DOMSource泪来关联要转换的Document对象。

       用javax.xml.transform.Stream.StreamResult对象来表示数据的目的地。

       Transformer对象通过TransformerFactory获得。

       在使用DOM解析XML文档时,需要读取整个XML文档,在内存中构架代表整个DOM树的Document对象,从而在对XML文档进行操作。

       DOM4J解析XML文档

       Dom4j是一个简单、灵活的开放源代码的库。Dom4j是由早期开发JDOM开放的。与JDOM不同的是,dom4j使用接口和抽象的人分离出来而后独立基类,虽然Dom4jSPI相对要复杂一些,但它提供了比JDOM更好的灵活性。

       Dom4j是一个非常优秀的Java XML API,具有性能优异、功能强大和极易使用的特点。现在很多软件采用的Dom4j,例如Hibernate,包括sun公司自己的JAXM也用了Dom4j。

使用Dom4j开发,需下载dom4j相应的jar文件。

Document对象

DOM4j中,获得Document对象的方式有三种:

              1.读取XML文件,获得document对象            

                   SAXReader reader = new SAXReader();
             Document   document = reader.read(new File("input.xml"));

              2.解析XML形式的文本,得到document对象.

                 String text = "<members></members>";
             Document document = DocumentHelper.parseText(text);

              3.主动创建document对象.

                 Document document = DocumentHelper.createDocument();
            //创建根节点

                  Element root = document.addElement("members");

       Tip:节点对象

1.获取文档的根节点.

        Elementroot = document.getRootElement();

2.取得某个节点的子节点.

              Elementelement=node.element(“书名");

3.取得节点的文字

       Stringtext=node.getText();

  4.取得某节点下所有名为“member”的子节点,并进行遍历.
 List nodes =rootElm.elements("member");
 
  for (Iterator it = nodes.iterator();it.hasNext();) {
     Element elm =(Element) it.next();
    // do something
 }

5.对某节点下的所有子节点进行遍历.
    for(Iterator it=root.elementIterator();it.hasNext();){
       Elementelement = (Element) it.next();
       //do something
    }

6.在某节点下添加子节点.
Element ageElm = newMemberElm.addElement("age");

7.设置节点文字.
 element.setText("29");

8.删除某节点.
//childElm是待删除的节点,parentElm是其父节点

          parentElm.remove(childElm);

9.添加一个CDATA节点.
Element contentElm = infoElm.addElement("content");
contentElm.addCDATA(diary.getContent());

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值