SAX解析器

 SAX解析器解析XML文档是基于事件驱动的。他将XML文档转化为一系列的事件,然后由事件处理器来决定如何处理。这种模式主要是基于事件源和事件处理器的。能产生事件的对象是事件源,对事件做出响应处理的对象被叫做事件处理器。

         而事件处理器则是org.xml.sax包中的ContentHandler、DTDHandler、ErrorHandler,以及EntityResolver这四个接口。他们分别处理事件源在解析过程中产生不同类的事件(其中DTDHandler为解析文档DTD时所用)。

          详细介绍如下表:

         

           以上事件处理器中,ContentHandler相对重要。

           

           在Android中使用SAX解析的步骤如下:

          

           第一步:新建一个工厂类SAXParserFactory,

SAXParserFactory factory = SAXParserFactory.newInstance();

           第二步:让工厂类产生一个SAX的解析类SAXParser

SAXParser parser = factory.newSAXParser();

           第三步:从SAXPsrser中得到一个XMLReader实例

XMLReader reader = parser.getXMLReader();

           第四步:把自己写的handler注册到XMLReader中,一般最重要的就是ContentHandler,代码如下:

MySAXHandler handler = new MySAXHandler();
reader.setContentHandler(handler);

           第五步:解析正式开始

reader.parse(is);
            

   其中XMLReader 对象使用如下方法:

/注册处理XML文档解析事件ContentHandler
public void setContentHandler(ContentHandler handler)

//开始解析一个XML文档
public void parse(InputSorce input) throws SAXException

  


         MySAXHandler是需要我们自己实现的ContentHandler.一般实现ContentHandler需要以下一些步骤:       

            1、声明一个类,继承DefaultHandler。DefaultHandler是一个基类,这个类里面简单实现了一个ContentHandler。我们只需要重写里面的方法即可。

            2、重写 startDocument() 和 endDocument(),一般解析将正式解析之前的一些初始化工资放到startDocument()里面,收尾的工作放到endDocument()里面。

            3、重写startElement(),XML解析器遇到XML里面的tag时就会调用这个函数。经常在这个函数内是通过localName俩进行判断而操作一些数据。

            4、重写characters()方法,这是一个回调方法。解析器执行完startElement()后,解析完节点的内容后就会执行这个方法,并且参数ch[]就是节点的内容。

            5、重写endElement()方法,这个方法与startElement()相对应,解析完一个tag节点后,执行这个方法。


[java]  view plain copy 在CODE上查看代码片 派生到我的代码片
  1. package com.liupan.parse;  
  2.   
  3. import org.xml.sax.Attributes;  
  4. import org.xml.sax.SAXException;  
  5. import org.xml.sax.helpers.DefaultHandler;  
  6. //DefaultHandler是一个基类,这个类里面简单实现了一个ContentHandler。我们只需要重写里面的方法即可。  
  7. public class MyHandler extends DefaultHandler{  
  8.   
  9.   
  10.       
  11.     //一般将正式解析前的一些初始化工作放到这里面,收尾工作放在endDocument中  
  12.     @Override  
  13.     public void startDocument() throws SAXException {  
  14.         // TODO Auto-generated method stub  
  15.         super.startDocument();  
  16.     }  
  17.     @Override  
  18.     public void endDocument() throws SAXException {  
  19.         // TODO Auto-generated method stub  
  20.         super.endDocument();  
  21.     }  
  22.       
  23. //  XML解析器遇到XML里面的tag时就会调用这个函数。经常在这个函数内是通过localName俩进行判断而操作一些数据。  
  24.     @Override  
  25.     public void startElement(String uri, String localName, String qName,  
  26.             Attributes attributes) throws SAXException {  
  27.         // TODO Auto-generated method stub  
  28.         /* 
  29.          * attributes Element节点的属性 
  30.          */  
  31.         super.startElement(uri, localName, qName, attributes);  
  32.     }  
  33.       
  34. //回调方法。解析器执行完startElement()后,解析完节点的内容后就会执行这个方法,并且参数ch[]就是节点的内容。  
  35.     @Override  
  36.     public void characters(char[] ch, int start, int length)  
  37.             throws SAXException {  
  38.         // TODO Auto-generated method stub  
  39.         String text = new String(ch, start, length);//取到Text节点内容  
  40.         super.characters(ch, start, length);  
  41.     }  
  42. //  这个方法与startElement()相对应,解析完一个tag节点后,执行这个方法。  
  43.     @Override  
  44.     public void endElement(String uri, String localName, String qName)  
  45.             throws SAXException {  
  46.         // TODO Auto-generated method stub  
  47.         super.endElement(uri, localName, qName);  
  48.     }  
  49.       
  50.   
  51. }  


             解析的时候会顺序触发相应的事件,其中的Element和Element之间的空格换行等都会触发characters函数,所以一般限定在

  <introduction>  北胶莱河,长100余公里 </introduction>这种时(通过一些布尔值来限制,或者一些整形的常量值

 final int RSS_TITLE = 1;
  final int RSS_LINK = 2;
  final int RSS_DESCRIPTION = 3;
    final int RSS_CATEGORY = 4;
    final int RSS_PUBDATE = 5;
),才是有效的。取到的值调用String 的trim()方法去掉左边和右边的空格
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值