XML文档解析

本文深入探讨了Java中解析XML文档的方法,包括DOM解析器和SAX解析器的使用,详细介绍了它们的工作流程和核心步骤,同时提供了具体的代码示例。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 

                              XML

Element 元素节点 ;Text 文本节点;Attr 属性节点

Node节点类型定义了作为节点的共性。getNodeName() getNodeType() getNodeValue()

文档对象,只有一个儿子,根节点

编写java程序完成xml文档的解析

DOM解析器

在 javax.xml.parsers 包中,定义了几个工厂类,程序员调用这些工厂类,可以得到对xml文档进行解析的 DOM 或 SAX 的解析器对象。

DocumentBuilder的对象是dom解析器,通过对应的工厂类创建

SAXParser的对象是sax解析器,通过对应的工厂类创建。

sax的工作流程,以下面的book.xml为例(不做dtd定义的验证,如果有这方面需求,可以查更详细的文档)。

<?xml version="1.0"?>

<books>

       <book type="computer">

              <title>java 2</title>

              <page>600</page>

              <author>Jim</author>

       </book>

              <book type="fiction">

              <title>fly to moon</title>

              <page>300</page>

              <author>Vernia</author>

       </book>

</books>

 

1.我们需要注册一个实现了sax标准的解析器,sun,java,apache等厂商和组织都实现了自己的解析器,大家可以直接拿过来用。

2.然后告诉解析器,我们会用哪个xml解析程序来处理xml文档。这个解析程序是由我们自己来实现的。

3在解析开始时,解析器会触发解析程序的startDocument()方法,告诉应用程序,文档解析开始了。

 

 

要注意以下几点:

1.区分解析器,解析程序的概念。

2.sax实现是事件驱动的,由解析器触发应用程序,而不是由应用程序来调用解析器。这和ui里的Actionlistener实现差不多。

3.startDocument()方法是由ContentHandler接口定义的,我们必须要实现他。xml解析程序就是用来实现这些方法的。为什么要这么做?因为sax不会定义在接收到方法触发后,会采取什么动作。只有我们自己才知道在解析的过程中,我们会做什么。不明白没有关系,再往下看。

4.当遇到<books>后,解析器会触发解析程序的startElement()方法,告诉应用程序,我遇到一个开始的标签。这个startElement()方法也是由ContentHandler接口定义的,他只是提醒应用程序他遇到一个标签的开始,至于是什么标签,他不知道,也不想知道。而由xml解析程序实现了的startElement()方法,功能就大了。比如我们可以判断这个标签的内容是什么,如果是books,好,正是我们需要的,要记到内存里;如果不是,放弃,继续往下走。

5.过了<books>后,解析器会触发解析程序的characters()方法,告诉应用程序,我遇到了标签的内容。同样的原理,由xml解析程序实现了的characters()方法会处理这个内容。当然了如果是我们需要的,就留下;如果不是就放弃。在这个例子里,<books>后面是空格,没有实际价值。

6.再往下遇到了<book type="computer">标签,同样触发的是startElement()方法。以此类推,在标签结束时,会触发endElement()方法,在文档结束时会触发endDocument()方法。至于每次触发一个方法后,产生什么动作,都是由我们的解析程序来控制的。

 

 

 1调用 DocumentBuilderFactory.newInstance() 方法得到创建 DOM 解析器的工厂。

    DocumentBuilderFactory factory= DocumentBuilderFactory.newInstance();

 2调用工厂对象的 newDocumentBuilder方法得到 DOM 解析器对象。

   DocumentBuilder db=factory.newDocumentBuilder();

 3调用 DOM 解析器对象的 parse() 方法解析 XML 文档,得到代表整个文档的 Document 对象,进行可以利用DOM特性对整个XML文档进行操作了。通过parse()装载一个xml文档。

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值