xml有哪些解析技术?区别是什么?
[color=darkred][b]DOM:[/b][/color]
处理大型文件时其性能下降的非常厉害。这个问题是由DOM的树结构所造成的,这种结构占用的内存较多,而且DOM必须在解析文件之前把整个文档装入内存,适合对XML的随机访问。
下面给出一个DOM解析xml文件的例子。
该例子的运行结果为:
[color=darkred][b]SAX:[/b][/color]
SAX是事件驱动型的XML解析方式。它顺序读取XML文件,不需要一次全部装载整个文件。当遇到像文件开头,文档结束,或者标签开头与标签结束时,它会触发一个事件,用户通过在其回调事件中写入处理代码来处理XML文件,适合对XML的顺序访问
同样给出一个例子。
运行结果:
[color=darkred][b]STAX:Streaming API for XML (StAX)[/b][/color]
[color=darkred][b]DOM:[/b][/color]
处理大型文件时其性能下降的非常厉害。这个问题是由DOM的树结构所造成的,这种结构占用的内存较多,而且DOM必须在解析文件之前把整个文档装入内存,适合对XML的随机访问。
下面给出一个DOM解析xml文件的例子。
package parse.impl;
import java.io.InputStream;
import java.util.ArrayList;
import java.util.List;
import javax.xml.parsers.DocumentBuilderFactory;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import parse.ParseXml;
import vo.Person;
public class DomXml implements ParseXml{
public List<Person> getPersons(InputStream inputStream) throws Exception {
List<Person> persons = new ArrayList<Person>();
Document document = DocumentBuilderFactory.newInstance().newDocumentBuilder().parse(inputStream);
Element element = document.getDocumentElement();
/**
* 获取person标签
*/
NodeList personNodes = element.getElementsByTagName("person");
/**
* 逐个处理person
*/
for(int i=0;i<personNodes.getLength();i++){
Element personElement = (Element)personNodes.item(i);
Person person = new Person();
//取出id
person.setIdCard(Integer.parseInt(personElement.getAttribute("idCard")));
//person的子节点
NodeList childNodes = personElement.getChildNodes();
//逐个处理子节点
for(int j=0;j<childNodes.getLength();j++){
System.out.println("节点"+j+":"+childNodes.item(j).getNodeName());
//判断是否是元素节点
if(childNodes.item(j).getNodeType()==Node.ELEMENT_NODE){
//判断子节点名称
if("name".equals(childNodes.item(j).getNodeName())){
person.setName(childNodes.item(j).getFirstChild().getNodeValue());
}else if("age".equals(childNodes.item(j).getNodeName())){
person.setAge(Integer.parseInt(childNodes.item(j).getFirstChild().getNodeValue()));
}else if("sex".equals(childNodes.item(j).getNodeName())){
person.setSex(childNodes.item(j).getFirstChild().getNodeValue());
}
}
}
persons.add(person);
}
return persons;
}
}
该例子的运行结果为:
节点0:#text
节点1:name
节点2:#text
节点3:age
节点4:#text
节点5:sex
节点6:#text
节点0:#text
节点1:name
节点2:#text
节点3:age
节点4:#text
节点5:sex
节点6:#text
idcard:1001,name:周健儿,age:52,sex:女
[color=darkred][b]SAX:[/b][/color]
SAX是事件驱动型的XML解析方式。它顺序读取XML文件,不需要一次全部装载整个文件。当遇到像文件开头,文档结束,或者标签开头与标签结束时,它会触发一个事件,用户通过在其回调事件中写入处理代码来处理XML文件,适合对XML的顺序访问
同样给出一个例子。
package parse.impl;
import java.io.InputStream;
import java.util.ArrayList;
import java.util.List;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;
import parse.ParseXml;
import vo.Person;
public class SaxXml extends DefaultHandler implements ParseXml {
List<Person> persons = new ArrayList<Person>();
protected void init(InputStream inputStream){
try{
SAXParserFactory spFactory = SAXParserFactory.newInstance();
SAXParser parser = spFactory.newSAXParser();
parser.parse(inputStream, new SaxXml());
}catch(Exception e){
e.printStackTrace();
}
}
public List<Person> getPersons(InputStream inputStream) throws Exception {
init(inputStream);
return persons;
}
@Override
public void endDocument() throws SAXException {
System.out.println("解析完毕");
}
@Override
public void skippedEntity(String name) throws SAXException {
System.out.println("这个在哪里"+name);
}
/**
* 开始标记调用
*/
@Override
public void startElement(String uri, String localName, String name,
Attributes attributes) throws SAXException {
for(int i=0;i<attributes.getLength();i++){
System.out.println("节点属性名称:"+attributes.getQName(i));
System.out.println("节点属性值:"+attributes.getValue(i));
}
}
@Override
public void characters(char[] ch, int start, int length)
throws SAXException {
System.out.println("节点数据:"+new String(ch,start,length));
}
/**
* 文件打开时调用该方法
*/
@Override
public void startDocument() throws SAXException {
System.out.println("开始解析xml文档");
}
}
运行结果:
开始解析xml文档
[color=darkred][b]STAX:Streaming API for XML (StAX)[/b][/color]