两种解析XML文档的方法-----DOM和SAX

最新推荐文章于 2025-12-03 20:31:34 发布

最新推荐文章于 2025-12-03 20:31:34 发布 · 57 阅读

文章标签：

#人工智能

本文介绍了两种解析XML文档的方法——DOM和SAX。详细解释了DOM方式下查找、删除、添加、修改节点的方法，以及SAX方式下事件处理解析XML文档的过程。包括节点查找、文本内容处理、元素属性修改等实用技巧。

两种解析XML文档的方法---DOM和SAX

DOM方式解析XML文件

DOC解析编程：

查找某一个节点

// 查找固定值的书的元素的第二个子节点

public static void findFixedChildren(Document doc) {

//通过名字查找并返回一个集合

NodeList list = doc.getElementsByTagName("书名");

for (int i = 0; i < list.getLength(); i++) {

//通过Item（）方法返回集合中的第i项

Node n = list.item(i);

System.out.println(n.getNodeName());

}

//查找书架中的子元素的第二个元素

int index = 2;

//获取集合中的长度并判断，如果长度》2，说明有要找的那个元素，然后找出并输出

if (list.getLength() >= 2) {

Node bookname = list.item(index);

System.out.println(bookname.getNodeName() +bookname.getNodeType()+ bookname.getNodeValue());

}

删除结点

// 删除节点

public static void deleteElement(Document doc) throws Exception {

// 获取要删除的那个节点对象

Node node = doc.getElementsByTagName("售价").item(1);

//getParentNode()是此节点的父节点

//removeChild() 从子节点列表中移除 oldChild 所指示的子节点，并将其返回。

node.getParentNode().removeChild(node);// removeChild

// 将内存中树状结构doc'写入到xml文档中

TransformerFactory factory = TransformerFactory.newInstance();

// 由工厂对象生成装换对象Transformer

Transformer trans = factory.newTransformer();

// 通过trans实现doc转换到xml文档，用的此方法中的参数是（Source，Result）,必须用此方法的实现了改接口的类才可以用,DOMSource实现了Suorce

// 需要一个DOMSource对象来代表源树

trans.transform(new DOMSource(doc), new StreamResult(new File(

"src/Book.xml")));

}

注意：将内存中树状结构doc'写入到xml文档中，在其中，当调用transform方法时，有两个参数，分别为Source和Resutl，但这两个数是接口，但必须在用的时候，要用实现了该接口的类才可以，所以用到了DOMSource 和StreamResult两个方法

TransformerFactory factory = TransformerFactory.newInstance()

Transformer trans = factory.newTransformer();

trans.transform(new DOMSource(doc), new StreamResult(new File(

"src/Book.xml")));

添加节点

// 节点的添加

public static void createElement(Document doc) throws Exception {

// 确定添加节点的位置,得到的是集合是父节点，通过标签名找，返回的是集合，要确定是哪个节点

Node book = doc.getElementsByTagName("书").item(0);

// 生成一个新节点

Element element = doc.createElement("出版社");

// element.setTextContent("清华大学");

Text text = doc.createTextNode("清华大学出版社");

element.appendChild(text);

// 在指定的位置把新生成的节点添加进去

book.appendChild(element);

// 将内存中树状结构doc'写入到xml文档中

TransformerFactory factory = TransformerFactory.newInstance();

// 由工厂对象生成装换对象Transformer

Transformer trans = factory.newTransformer();

// 通过trans实现doc转换到xml文档，用的此方法中的参数是（Source，Result）,必须用此方法的实现了改接口的类才可以用,DOMSource实现了Suorce

// 需要一个DOMSource对象来代表源树

trans.transform(new DOMSource(doc), new StreamResult(new File(

"src/Book.xml")));

}

插入节点

public static void createFileElement(Document doc) throws Exception {

// 确定插入点的位置

Node author = doc.getElementsByTagName("作者").item(0);

Node parent = author.getParentNode();// 指定插入到作者之前

//插入到author的后面

Node brothder = author.getNextSibling();

// 创建新节点

Element element = doc.createElement("出版社");

element.setTextContent("清华大学出版社");

// 插入节点，在书这个节点中在作者前插入

// parent.insertBefore(element, author);//()

parent.insertBefore(element, brothder);

// 将内存中树状结构doc'写入到xml文档中

TransformerFactory factory = TransformerFactory.newInstance();

// 由工厂对象生成装换对象Transformer

Transformer trans = factory.newTransformer();

// 通过trans实现doc转换到xml文档，用的此方法中的参数是（Source，Result）,必须用此方法的实现了改接口的类才可以用,DOMSource实现了Suorce

// 需要一个DOMSource对象来代表源树

trans.transform(new DOMSource(doc), new StreamResult(new File(

"src/Book.xml")));

}

修改节点

public static void updateElement(Document doc) throws Exception {

// 获取要更新的对象

Node node = doc.getElementsByTagName("售价").item(0);

node.setTextContent("500");

// 修改属性

if (node instanceof Element) {

Element element = (Element) node;

Attr att = element.getAttributeNode("type");

att.setValue("美元");

}

// 将内存中树状结构doc'写入到xml文档中

TransformerFactory factory = TransformerFactory.newInstance();

// 由工厂对象生成装换对象Transformer

Transformer trans = factory.newTransformer();

// 通过trans实现doc转换到xml文档，用的此方法中的参数是（Source，Result）,必须用此方法的实现了改接口的类才可以用,DOMSource实现了Suorce

// 需要一个DOMSource对象来代表源树

trans.transform(new DOMSource(doc), new StreamResult(new File(

"src/Book.xml")));

}

Node方法的总结：

（1）node.getNodeType() 得到的是节点的类型元素节点类型是1 文本节点为 3

（2）node.getNodeValue() 元素的值为空因为节点是Element，所有返回的是null

（3）得到元素中的内容的方法：

node.getTextContent()

Text text = (Text)node.getChildNoddes().item(0) Text.getNodeValues()

SAM解析xml文档

（1）SAM解析的优点：

SAX解析允许在读取文档的时候，即对文档进行处理，而不必等到整个文档装载完才会文档进行操作。

（2）SAM解析的分析：

SAX采用事件处理的方式解析XML文件，利用 SAX 解析 XML 文档，涉及两个部分：解析器和事件处理器：

• 解析器可以使用JAXP的API创建，创建出SAX解析器后，就可以指定解析器去解析某个XML文档。

• 解析器采用SAX方式在解析某个XML文档时，它只要解析到XML文档的一个组成部分，都会去调用事件处理器的一个方法，解析器在调用事件处理器的方法时，会把当前解析到的xml文件内容作为方法的参数传递给事件处理器。

• 事件处理器由程序员编写，程序员通过事件处理器中方法的参数，就可以很轻松地得到sax解析器解析到的数据，从而可以决定如何对数据进行处理。

（3）SAM解析的步骤：

//获取SAX解析器工厂类的对象

SAXParserFactory factory = SAXParserFactory.newInstance();

//获取Sax解析器

SAXParser sax = factory.newSAXParser();

//通过解析器解析xml文档

//BookHandler事件处理器

sax.parse(new File("src/Book.xml"),new BookHandler());

BookHandler是事件处理器，要想调用必须要重写DefaultHandler中的方法来实现功能，

class BookHandler extends DefaultHandler{

private boolean flag = false;

@Override

//标签体的内容的解析的方法

public void characters(char[] ch, int start, int length) throws SAXException {

// TODO Auto-generated method stub

super.characters(ch, start, length);

if(flag = true){

System.out.println("元素的内容为："+new String(ch,start,length));

}

//flag = false;

}

@Override

//文档结束时调用的方法

public void endDocument() throws SAXException {

// TODO Auto-generated method stub

super.endDocument();

System.out.println("xml文档的结束");

}

@Override

//结束时调用的元素

public void endElement(String uri, String locaName, String qName)

throws SAXException {

// TODO Auto-generated method stub

super.endElement(uri, locaName, qName);

//System.out.println("元素的结束:"+qName);

if(qName.equals("书")){

flag = false;

}

@Override

public void startDocument() throws SAXException {

// TODO Auto-generated method stub

super.startDocument();

System.out.println("xml文档的开始");

}

@Override

public void startElement(String uri, String locaName, String qName,

Attributes attributes) throws SAXException {

// TODO Auto-generated method stub

super.startElement(uri, locaName, qName, attributes);

// System.out.println("元素的开启:"+qName);

if(qName.equals("书")){

System.out.println("元素的开启:"+qName);

flag = true;

}