两种解析XML文档的方法-----DOM和SAX

本文介绍了两种解析XML文档的方法——DOM和SAX。详细解释了DOM方式下查找、删除、添加、修改节点的方法,以及SAX方式下事件处理解析XML文档的过程。包括节点查找、文本内容处理、元素属性修改等实用技巧。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

两种解析XML文档的方法---DOM和SAX

DOM方式解析XML文件

DOC解析编程:

查找某一个节点

// 查找固定值的书的元素的第二个子节点

public static void findFixedChildren(Document doc) {

//通过名字查找并返回一个集合

NodeList list = doc.getElementsByTagName("书名");

for (int i = 0; i < list.getLength(); i++) {

//通过Item()方法返回集合中的第i项

Node n = list.item(i);

System.out.println(n.getNodeName());

}

//查找书架中的子元素的第二个元素

int index = 2;

//获取集合中的长度并判断,如果长度》2,说明有要找的那个元素,然后找出并输出

if (list.getLength() >= 2) {

Node bookname = list.item(index);

System.out.println(bookname.getNodeName() +bookname.getNodeType()+ bookname.getNodeValue());

}

删除结点

// 删除节点

public static void deleteElement(Document doc) throws Exception {

// 获取要删除的那个节点对象

Node node = doc.getElementsByTagName("售价").item(1);

//getParentNode()是此节点的父节点

//removeChild() 从子节点列表中移除 oldChild 所指示的子节点,并将其返回。

node.getParentNode().removeChild(node);// removeChild

// 将内存中树状结构doc'写入到xml文档中

TransformerFactory factory = TransformerFactory.newInstance();

// 由工厂对象生成装换对象Transformer

Transformer trans = factory.newTransformer();

// 通过trans实现doc转换到xml文档,用的此方法中的参数是(Source,Result),必须用此方法的实现了改接口的类才可以用,DOMSource实现了Suorce

// 需要一个DOMSource对象来代表源树

trans.transform(new DOMSource(doc), new StreamResult(new File(

"src/Book.xml")));

}

注意:将内存中树状结构doc'写入到xml文档中,在其中,当调用transform方法时,有两个参数,分别为Source和Resutl,但这两个数是接口,但必须在用的时候,要用实现了该接口的类才可以,所以用到了DOMSource 和StreamResult两个方法

TransformerFactory factory = TransformerFactory.newInstance()

Transformer trans = factory.newTransformer();

trans.transform(new DOMSource(doc), new StreamResult(new File(

"src/Book.xml")));

添加节点

// 节点的添加

public static void createElement(Document doc) throws Exception {

// 确定添加节点 的位置,得到的是集合是父节点,通过标签名找,返回的是集合,要确定是哪个节点

Node book = doc.getElementsByTagName("书").item(0);

// 生成一个新节点

Element element = doc.createElement("出版社");

// element.setTextContent("清华大学");

Text text = doc.createTextNode("清华大学出版社");

element.appendChild(text);

// 在指定 的位置把新生成的节点添加进去

book.appendChild(element);

// 将内存中树状结构doc'写入到xml文档中

TransformerFactory factory = TransformerFactory.newInstance();

// 由工厂对象生成装换对象Transformer

Transformer trans = factory.newTransformer();

// 通过trans实现doc转换到xml文档,用的此方法中的参数是(Source,Result),必须用此方法的实现了改接口的类才可以用,DOMSource实现了Suorce

// 需要一个DOMSource对象来代表源树

trans.transform(new DOMSource(doc), new StreamResult(new File(

"src/Book.xml")));

}

插入节点

public static void createFileElement(Document doc) throws Exception {

// 确定插入点的位置

Node author = doc.getElementsByTagName("作者").item(0);

Node parent = author.getParentNode();// 指定插入到作者之前

//插入到author的后面

Node brothder = author.getNextSibling();

// 创建新节点

Element element = doc.createElement("出版社");

element.setTextContent("清华大学出版社");

// 插入节点,在书这个节点中在作者前插入

// parent.insertBefore(element, author);//()

parent.insertBefore(element, brothder);

// 将内存中树状结构doc'写入到xml文档中

TransformerFactory factory = TransformerFactory.newInstance();

// 由工厂对象生成装换对象Transformer

Transformer trans = factory.newTransformer();

// 通过trans实现doc转换到xml文档,用的此方法中的参数是(Source,Result),必须用此方法的实现了改接口的类才可以用,DOMSource实现了Suorce

// 需要一个DOMSource对象来代表源树

trans.transform(new DOMSource(doc), new StreamResult(new File(

"src/Book.xml")));

}

修改节点

public static void updateElement(Document doc) throws Exception {

// 获取要更新的对象

Node node = doc.getElementsByTagName("售价").item(0);

node.setTextContent("500");

// 修改属性

if (node instanceof Element) {

Element element = (Element) node;

Attr att = element.getAttributeNode("type");

att.setValue("美元");

}

// 将内存中树状结构doc'写入到xml文档中

TransformerFactory factory = TransformerFactory.newInstance();

// 由工厂对象生成装换对象Transformer

Transformer trans = factory.newTransformer();

// 通过trans实现doc转换到xml文档,用的此方法中的参数是(Source,Result),必须用此方法的实现了改接口的类才可以用,DOMSource实现了Suorce

// 需要一个DOMSource对象来代表源树

trans.transform(new DOMSource(doc), new StreamResult(new File(

"src/Book.xml")));

}

Node方法的总结:

(1)node.getNodeType() 得到的是节点的类型 元素节点类型是1 文本节点为 3

(2)node.getNodeValue() 元素的值为空 因为节点是Element,所有返回的是null

(3)得到元素中的内容的方法:

node.getTextContent()

Text text = (Text)node.getChildNoddes().item(0) Text.getNodeValues()

SAM解析xml文档

(1)SAM解析的优点:

SAX解析允许在读取文档的时候,即对文档进行处理,而不必等到整个文档装载完才会文档进行操作。

(2)SAM解析的分析:

SAX采用事件处理的方式解析XML文件,利用 SAX 解析 XML 文档,涉及两个部分:解析器和事件处理器:

• 解析器可以使用JAXP的API创建,创建出SAX解析器后,就可以指定解析器去解析某个XML文档。

• 解析器采用SAX方式在解析某个XML文档时,它只要解析到XML文档的一个组成部分,都会去调用事件处理器的一个方法,解析器在调用事件处理器的方法时,会把当前解析到的xml文件内容作为方法的参数传递给事件处理器。

• 事件处理器由程序员编写,程序员通过事件处理器中方法的参数,就可以很轻松地得到sax解析器解析到的数据,从而可以决定如何对数据进行处理。

(3)SAM解析的步骤:

//获取SAX解析器工厂类的对象

SAXParserFactory factory = SAXParserFactory.newInstance();

//获取Sax解析器

SAXParser sax = factory.newSAXParser();

//通过解析器解析xml文档

//BookHandler事件处理器

sax.parse(new File("src/Book.xml"),new BookHandler());

BookHandler是事件处理器,要想调用必须要重写DefaultHandler中的方法来实现功能,

class BookHandler extends DefaultHandler{

private boolean flag = false;

@Override

//标签体的内容的解析的方法

public void characters(char[] ch, int start, int length) throws SAXException {

// TODO Auto-generated method stub

super.characters(ch, start, length);

if(flag = true){

System.out.println("元素的内容为:"+new String(ch,start,length));

}

//flag = false;

}

@Override

//文档结束时调用的方法

public void endDocument() throws SAXException {

// TODO Auto-generated method stub

super.endDocument();

System.out.println("xml文档的结束");

}

@Override

//结束时调用的元素

public void endElement(String uri, String locaName, String qName)

throws SAXException {

// TODO Auto-generated method stub

super.endElement(uri, locaName, qName);

//System.out.println("元素的结束:"+qName);

if(qName.equals("书")){

flag = false;

}

}

@Override

public void startDocument() throws SAXException {

// TODO Auto-generated method stub

super.startDocument();

System.out.println("xml文档的开始");

}

@Override

public void startElement(String uri, String locaName, String qName,

Attributes attributes) throws SAXException {

// TODO Auto-generated method stub

super.startElement(uri, locaName, qName, attributes);

// System.out.println("元素的开启:"+qName);

if(qName.equals("书")){

System.out.println("元素的开启:"+qName);

flag = true;

}

}

}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值