转载时请注明转自:http://blog.youkuaiyun.com/sam_zhang1984
交流可加新浪微博:Android开发人
解析 XML 有两种方式: SAX 和 DOM 。它们各有利弊。
DOM 是把 XML 文档全部装载到内存中,然后当成一树进行处理。其好处是当成树处理起来比较方便,但弊端是如果 XML 文件比较大时,会对内存消耗比较大;
SAX 是逐行扫描 XML 文档,逐行解析,而且可以在处理 XML 文档过程中的任意时刻中止处理过程,比如找到我们的目标节点,剩下的 XML 文档内容就可以不读了,直接结束。其弊端是操作起来相对不方便,而且对 XML 文档进行处理,如果修改、新增、删除等操作比较不方便。
SAX 是事件驱动型 XML 解析的一个标准接口。它的工作原理是读到文档的开始与结束、标签元素的开始与结束、内容实体等地方时,触发相应的函数,我们就可以在相应的函数中进行我们所要进行的处理。
XML 解析主要需要进行下列步骤:
1. 创建事件处理程序
2. 创建 SAX 解析器
3. 将事件处理程序分配给解析器
4. 对文档进行解析,将每个事件发送给处理程序。
创建事件处理程序,即实现ContentHandler 接口,但由于ContentHandler 里有很多方法,而不是我们必须要用到的,所以我们采用的办法是继承DefaultHandler。
当一个接口 A 中有很多方法,但我们并不需要那么多方法时,如果直接实现这个接口,则需要实现很多对我们没用的方法;于是就添加一个类 B ,去实现这个接口 A 中的所有方法,但这些方法都是空方法,这样,以后如果要用到接口 A 时,则不需要去实现 A ,而是直接继承类 B ,然后选一些我们需要的方法进行重写就行了。
而DefaultHandler就是实现了 ContentHandler 接口方法,但都是空方法,我们就是通过继承DefaultHandler 来创建自己的事件程序,并在相应的事件中对XML文件进行解析,代码如下:
创建 SAX 解析器和 将事件处理程序分配给解析器,就是应用SAX的里面的函数,代码如下:
注意 : ContentHandler 类 中的 characters 是在每一次读完标签后都执行一次,无论是开始标签还是结束标签,区别只在于开始标签读到的内容,即传进来的 char[] ch 是有值的(前提是这个标签有内容 ),而结束标签传进来的 char[] ch 是空的。所以为避免读到错误信息,必须在标签结束时,把存放标签名的变量赋空空值,不然执行完结束标签再去执行读 XML 实体函数 characters 时,就会以一个在判断时误判断成某一个标签,从而把一个空值(读结束标签后,当然是没有值的,所以调用 characters 传进来的值是空值 )赋给我们的目标。