在Android中解析XML文主要有三种方式,分别为Simple API for XML(SAX)、Document Object Model(DOM)和Android附带的pull解析器。下面首先介绍第一种SAX方式解析XML文件。
SAX是一个解析速度非常快并且占用内存少的XML解析器,非常适合Android等移动设备。SAX解析XML文件采用事件驱动的方式进行,也就是说SAX是逐行扫描文件,遇到符合条件的设定条件后就会触发特定的事件,回调你写好的事件处理程序。
SAX的优势在于其解析速度较快,占用内存较少(相对于DOM而言)。而且SAX在解析文件的过程中得到自己需要的信息后可以随时终止解析,并不一定要等文件全部解析完毕。
凡事有利必有弊,其劣势在于SAX采用的是流式处理方式,当遇到某个标签的时候,它并不会记录下以前所遇到的标签,也就是说,在处理某个标签的时候,比如在startElement方法中,所能够得到的信息就是标签的名字和属性,至于标签内部的嵌套结构,上层标签、下层标签以及其兄弟节点的名称等等与其结构相关的信息都是不得而知的。实际上就是把XML文件的结构信息丢掉了,如果需要得到这些信息的话,只能你自己在程序里进行处理了。所以相对DOM而言,SAX处理XML文档没有DOM方便,SAX处理的过程相对DOM而言也比较复杂。
SAX的回调事件定义在ContentHandler接口中,下面是一些ContentHandler接口常用的方法:
startDocument()
当遇到文档的开头的时候,调用这个方法,可以在其中做一些预处理的工作。
endDocument()
和上面的方法相对应,当文档结束的时候,调用这个方法,可以在其中做一些善后的工作。
startElement(String namespaceURI, String localName, String qName, Attributes atts)
当读到一个开始标签的时候,会触发这个方法。namespaceURI就是命名空间,localName是不带命名空间前缀的标签名,qName是带命名空间前缀的标签名。通过atts可以得到所有的属性名和相应的值。要注意的是SAX中一个重要的特点就是它的流式处理,当遇到一个标签的时候,它并不会纪录下以前所碰到的标签,也就是说,在startElement()方法中,所有你所知道的信息,就是标签的名字和属性,至于标签的嵌套结构,上层标签的名字,是否有子元属等等其它与结构相关的信息,都是不得而知的,都需要你的程序来完成。这使得SAX在编程处理上没有DOM来得那么方便。
endElement(String uri, String localName, String name)
这个方法和上面的方法相对应,在遇到结束标签的时候,调用这个方法。
characters(char[] ch, int start, int length)
这个方法用来处理在XML文件中读到的内容,第一个参数为文件的字符串内容,后面两个参数是读到的字符串在这个数组中的起始位置和长度,使用new String(ch,start,length)就可以获取内容。
下面一起写一个测试SAX解析XML文件的DEMO
首先新建一个Android工程,工程结构如下图:
新建一个测试用的XML文件,名称:student.xml
<?xml version="1.0" encoding="UTF-8"?>
<students>
<student id="20110701100">
<name>张三</name>
<age>22</age>
<sex>男</sex>
</student >
<student id="20110701101">
<name>李四</name>
<age>24</age>
<sex>男</sex>
</student >
<student id="20110701102">
<name>小丽</name>
<age>21</age>
<sex>女</sex>
</student >
</students>
将该文件放置在assets目录下。
接下来我们定义一个JavaBean,用来存放从XML文件中解析出来的数据:
Student.java
package com.xzq.bean;
public class Student {
private String name;
private String id;
private int age;
private String sex;
public String getSex() {
return sex;
}
public void setSex(String sex) {
this.sex = sex;
}
public Student() {
super();
}
public String getName() {
return name;
}
public void setName(String name) {
this.name = name;
}
public String getId() {
return id;
}
public void setId(String id) {
this.id = id;
}
public int getAge() {
return age;
}
public void setAge(int age) {
this.age = age;
}
}
接着我们定义一个使用SAX解析XML文件的工具类:
package com.xzq.xmlparser.util;
import java.io.IOException;
import java.io.InputStream;
import java.util.List;
import javax.xml.parsers.ParserConfigurationException;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import org.xml.sax.SAXException;
import com.xzq.bean.Student;
public class ParserBySAX {
public static List<Student> parseXML(InputStream input) {
try {
SAXParserFactory factory = SAXParserFactory.newInstance();
SAXParser parser = factory.newSAXParser();
XMLContentHandler handler = new XMLContentHandler();
parser.parse(input, handler);
input.close();
return handler.getStudents();
} catch (ParserConfigurationException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} catch (SAXException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
return null;
}
}
在该类中我们定义了一个parseXML(InputStream input)方法,该方法接收一个输入流,并创建了SAX解析器工厂以及SAXParse的实例。下面我创建了一个真正用来解析文件的类,该类继承自DefaultHandler。这里啰嗦几句,上面说到SAX定义的回调方法都定义在ContentHandler接口中,我们可以直接实现该接口,因为我们可能只关心其中某个事件,并不像实现接口中的所有方法(因为根据Java语法,实现接口就必须实现接口中的所有方法),用起来比较麻烦。而DefaultHandler默认实现了ContentHandler接口,只不过其中的方法体都为空而已。
package com.xzq.xmlparser.util;
import java.util.ArrayList;
import java.util.List;
import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;
import com.xzq.bean.Student;
public class XMLContentHandler extends DefaultHandler {
private List<Student> students = null;
private Student current;
private String tagName = null;
public List<Student> getStudents() {
return students;
}
/*
* 接收文档的开始的通知。
*/
@Override
public void startDocument() throws SAXException {
students = new ArrayList<Student>();
}
/*
* 接收字符数据的通知。
*/
@Override
public void characters(char[] ch, int start, int length)
throws SAXException {
if (tagName != null) {
String data = new String(ch, start, length);
if (tagName.equals("name")) {
this.current.setName(data);
} else if (tagName.equals("sex")) {
this.current.setSex(data);
} else if (tagName.equals("age")) {
this.current.setAge(Integer.parseInt(data));
}
}
}
/*
* 接收元素开始的通知。 参数意义如下: namespaceURI:元素的命名空间 localName :元素的本地名称(不带前缀) qName
* :元素的限定名(带前缀) atts :元素的属性集合
*/
@Override
public void startElement(String namespaceURI, String localName,
String qName, Attributes atts) throws SAXException {
if (localName.equals("student")) {
current = new Student();
current.setId((atts.getValue("id")));
}
this.tagName = localName;
}
/*
* 接收文档的结尾的通知。 参数意义如下: uri :元素的命名空间 localName :元素的本地名称(不带前缀) name
* :元素的限定名(带前缀)
*/
@Override
public void endElement(String uri, String localName, String name)
throws SAXException {
if (localName.equals("student")) {
students.add(current);
current = null;
}
this.tagName = null;
}
}
最后是MainActivity类,该类是整个Android工程的入口,实现如下:
package com.xzq.xmlparser;
import java.io.IOException;
import java.io.InputStream;
import java.util.List;
import com.xzq.bean.Student;
import com.xzq.xmlparser.util.ParserBySAX;
import android.app.Activity;
import android.content.res.AssetManager;
import android.os.Bundle;
public class MainActivity extends Activity {
/** Called when the activity is first created. */
@Override
public void onCreate(Bundle savedInstanceState) {
super.onCreate(savedInstanceState);
setContentView(R.layout.main);
AssetManager asset = getAssets();
try {
InputStream input = asset.open("Student.xml");
List<Student> list = ParserBySAX.parseXML(input);
for (Student stu : list) {
System.out.println("Person ID: " + stu.getId() + ","
+ stu.getName() + ", " + stu.getAge() + ", "
+ stu.getSex());
}
} catch (IOException e) {
e.printStackTrace();
}
}
}
在这里,我们仅仅是将解析得到信息打印在了Logcat中,你可以在自己的应用中使用listview等空间将解析得到的数据显示在屏幕上。欢迎发送邮件到我的邮箱一起交流:zhongnan09@gmail.com。