XML解析之SAX

SAX解析XML详解

最新推荐文章于 2023-03-09 14:05:34 发布

最新推荐文章于 2023-03-09 14:05:34 发布 · 103 阅读

文章标签：

#XML

Java 专栏收录该内容

18 篇文章

订阅专栏

部署运行你感兴趣的模型镜像

SAX是一个用于处理XML事件驱动的“推”模型，虽然它不是W3C标准，但它却是一个得到了广泛认可的API。SAX解析器不像DOM那样建立一个完整的文档树，而是在读取文档时激活一系列事件，这些事件被推给事件处理器，然后由事件处理器提供对文档内容的访问。常见的事件处理器有三种基本类型：
[list][*] 用于访问XML DTD内容的DTDHandler；
[*] 用于低级访问解析错误的ErrorHandler；
[*] 用于访问文档内容的ContentHandler，这也是最普遍使用的事件处理器。[/list]
与DOM相比，SAX解析器能提供更好的性能优势，它提供对XML文档内容的有效低级访问。SAX模型最大的优点是内存消耗小，因为整个文档无需一次加载到内存中，这使SAX解析器可以解析大于系统内存的文档。另外，你无需像在DOM中那样为所有节点创建对象。最后，SAX“推”模型可用于广播环境，能够同时注册多个ContentHandler，并行接收事件，而不是在一个管道中一个接一个地进行处理。

SAX的缺点是你必须实现多个事件处理程序以便能够处理所有到来的事件，同时你还必须在应用程序代码中维护这个事件状态，因为SAX解析器不能交流元信息，如DOM的父/子支持，所以你必须跟踪解析器处在文档层次的哪个位置。如此一来，你的文档越复杂，你的应用逻辑就越复杂。虽然没有必要一次将整个文档加载到内存中，但SAX解析器仍然需要解析整个文档，这点和DOM一样。

也许SAX面临的最大问题是它没有内置如XPath所提供的那些导航支持。再加上它的单遍解析，使它不能支持随机访问。这一限制也表现在名字空间上：对有继承名字空间的元素不做注解。这些限制使SAX很少被用于操作或修改文档。

那些只需要单遍读取内容的应用程序可以从SAX解析中大大受益。很多B2B和EAI应用程序将XML用做封装格式，接收端用这种格式简单地接收所有数据。这就是SAX明显优于DOM的地方：因高效而获得高吞吐率。在SAX 2.0 中有一个内置的过滤机制，可以很轻松地输出一个文档子集或进行简单的文档转换。


public class SAXParse {

	public static void main(String[] args) {
		try {
			SAXParserFactory sf = SAXParserFactory.newInstance();
			SAXParser sp = sf.newSAXParser();
			DefaultHandler mySAXHandler = null;
			mySAXHandler = new MySAXHandler();
			sp.parse(new InputSource("user.xml"), mySAXHandler);
		} catch (IOException e) {
			e.printStackTrace();
		} catch (SAXException e) {
			e.printStackTrace();
		} catch (Exception e) {
			e.printStackTrace();
		}
	}
}

class MySAXHandler extends DefaultHandler {

    boolean hasAttribute=false;
    Attributes attributes=null;

    public void startDocument() throws SAXException {
 	   System.out.println("*******Start parsing document******");
    }

    public void endDocument() throws SAXException {
 	   System.out.println("*******End parsing document*******");
    }

    public void startElement(String uri, String localName, String qName,
                  Attributes attributes) throws SAXException {
           if(qName.equals("users")){
                  return;
           }
           if(qName.equals("user")){
                  System.out.print(attributes.getQName(0)+ " = "+attributes.getValue(0));
           }
           if(attributes.getLength()>0){
                  this.attributes=attributes;
                  this.hasAttribute=true;
           }
    }

    public void endElement(String uri, String localName, String qName)
                  throws SAXException {
           if(hasAttribute&&(attributes!=null)){
                  for(int i=0;i<attributes.getLength();i++){
                         System.out.print(attributes.getQName(0)+attributes.getValue(0));
                  }
           }
    }

    public void characters(char[] ch, int start, int length)
                  throws SAXException {
           System.out.print(new String(ch,start,length));
    }
}