学习笔记,xml的解析方法

本文介绍了三种主流的XML解析方法:DOM、SAX和dom4j。详细解释了每种方法的特点及应用场景,并提供了具体的Java代码示例,包括读取、添加、删除XML标签等操作。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

XML解析方式:

一种是dom(Document Object Model,即文档对象模型,W3C组织推荐),在使用dom解析XML文档时,需要读取整个XML文档,在内存中架构代表整个dom树的document对象,从而再对XML文档进行操作。如果XML文档特别大,就会大量消耗计算机的内存,甚至可能导致内存溢出。

一种是sax(Simple API for XML,不是官方标准,但所有XML解析器都支持它)。sax解析允许读取文档的时候,就对文档进行处理,而不必等到整个文档都读进内存再进行操作。

XML解析开发包:Jaxp(sun)、Jdom、dom4j。
首先是Jaxp解析XML,Jaxp开发包是J2SE的一部分,由javax.xml、org.w3c.dom、org.xml.sax包以及其子包组成。
示例读取xml标签内容:

	public void read() throws Exception {
		//用工厂方法获将xml解析成document
		//创建工厂
		DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
		//得到DOM解析器
		DocumentBuilder builder = factory.newDocumentBuilder();
		//解析xml文档,得到document
		Document doc = builder.parse("src/xml/book.xml");
		//得到所有<书>标签
		NodeList list = doc.getElementsByTagName("书");
		//获得第二个<书>标签
		Node node = list.item(1);
		//获取标签内容
		String s = node.getTextContent();
		
		System.out.println(s);
	}


示例xml添加新标签:

	// 向文档中指定位置插入新节点,创建一个<作者>bbb</作者>,放在第二个<书>标签的<价格>标签前
	@Test
	public void add2() throws Exception {
		//用工厂方法将xml解析成document
		DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
		DocumentBuilder builder = factory.newDocumentBuilder();
		Document doc = builder.parse("src/xml/book.xml");
		
		//创建一个新标签<作者>
		Element newE = doc.createElement("作者");
		//设置标签内容bbb
		newE.setTextContent("bbb");
		//获取<价格>标签,作为参考点
		Element refE = (Element) doc.getElementsByTagName("价格").item(1);
		//获取第二个<书>标签
		Element e = (Element) doc.getElementsByTagName("书").item(1);
		//将新建标签<作者>,添加到指定位置(<价格>标签之前)
		e.insertBefore(newE, refE);

		//创建转换工厂
		TransformerFactory tfFactory = TransformerFactory.newInstance();
		//创建转换新实例
		Transformer tf = tfFactory.newTransformer();
		//将内存中document转换成xml输出
		tf.transform(new DOMSource(doc), new StreamResult(new FileOutputStream("src/book.xml")));
	}
然后是sax解析XML,sax采用事件处理的方式解析XML文件,利用sax解析XML文件,需要解析器和事件处理器。解析器可以使用Jaxp的API创建,创建好sax解析器后就可以制定解析器去解析某个XML文档。在这个过程中,sax同时会去调用一个事件处理器的方法,并把解析的XML文件内容当做方法参数传递给事件处理器。

示例如下:

package xml.sax;

import javax.xml.parsers.ParserConfigurationException;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;

import org.xml.sax.Attributes;
import org.xml.sax.ContentHandler;
import org.xml.sax.Locator;
import org.xml.sax.SAXException;
import org.xml.sax.XMLReader;

public class SaxDemo1 {

	public static void main(String[] args) throws Exception {
		// 1.创建解析工厂
		SAXParserFactory factory = SAXParserFactory.newInstance();
		// 2.得到解析器
		SAXParser sp = factory.newSAXParser();
		// 3.得到读取内容
		XMLReader reader = sp.getXMLReader();
		// 4.设置内容处理器
		reader.setContentHandler(new ListHandler());
		// 5.读取xml文档内容
		reader.parse("src/xml/book.xml");
	}
}

//创建自己的事件处理器
class ListHandler implements ContentHandler {

	//开始标签
	public void startElement(String uri, String localName, String qName,
			Attributes atts) throws SAXException {
		// TODO Auto-generated method stub
		String name = "<" + qName;
		for (int i = 0; atts != null && i < atts.getLength(); i++) {
			name += " " + atts.getQName(i) + "=" + atts.getValue(i);
		}
		System.out.println(name + ">");
	}
	//标签内容
	public void characters(char[] ch, int start, int length)
			throws SAXException {
		// TODO Auto-generated method stub
		System.out.println(new String(ch, start, length));
	}
	//结束标签
	public void endElement(String uri, String localName, String qName)
			throws SAXException {
		// TODO Auto-generated method stub
		System.out.println("</" + qName + ">");
	}

	public void endDocument() throws SAXException {
		// TODO Auto-generated method stub

	}

	public void endPrefixMapping(String prefix) throws SAXException {
		// TODO Auto-generated method stub

	}

	public void ignorableWhitespace(char[] ch, int start, int length)
			throws SAXException {
		// TODO Auto-generated method stub

	}

	public void processingInstruction(String target, String data)
			throws SAXException {
		// TODO Auto-generated method stub

	}

	public void setDocumentLocator(Locator locator) {
		// TODO Auto-generated method stub

	}

	public void skippedEntity(String name) throws SAXException {
		// TODO Auto-generated method stub

	}

	public void startDocument() throws SAXException {
		// TODO Auto-generated method stub

	}

	public void startPrefixMapping(String prefix, String uri)
			throws SAXException {
		// TODO Auto-generated method stub

	}

}
最后是dom4j解析XML,一个优秀的Java XML API,虽然API相对上边的两种要复杂一些,但胜在灵活易用且更能强大。
使用dom4j开发,需要下载相应的jar文件。
示例读取XML:
	public void read() throws Exception{
		//创建解析器
		SAXReader reader = new SAXReader();
		//解析XML文档,获得document
		Document doc = reader.read(new File("src/xml/book.xml"));
		//获得根节点
		Element root = doc.getRootElement();
		//获取根节点下面的指定节点<书>
		Element book = (Element)root.elements("书").get(1);
		//获取<书>节点下,指定节点<作者>的内容
		String author = book.element("作者").getText();
		//打印输出
		System.out.println(author);
	}
示例读取标签属性:
	public void readAttr() throws Exception{
		//解析XML,获取document
		SAXReader reader = new SAXReader();
		Document doc = reader.read(new File("src/xml/book.xml"));
		//获取标签
		Element root = doc.getRootElement();
		Element book = (Element)root.elements("书").get(1);
		//获取标签name属性
		String name = book.element("书名").attributeValue("name");
		System.out.println("name = "+name);
	}
示例添加新标签:
	public void add() throws Exception{
		//解析XML,获取document
		SAXReader reader = new SAXReader();
		Document doc = reader.read(new File("src/xml/book.xml"));
		//获取标签,为要添加的标签指定位置
		Element root = doc.getRootElement();
		Element book = (Element)root.elements("书").get(0);
		//添加新标签
		book.addElement("test").setText("test1");
/*
//		这个方法将document转换成XML,但是编码限定于UTF-8
//		XMLWriter writer = new XMLWriter(new OutputStreamWriter(new FileOutputStream("src/xml/book.xml"),"UTF-8"));
*/
		//设置输出编码为gb2312
		OutputFormat format = OutputFormat.createPrettyPrint();
		format.setEncoding("gb2312");
		//按着设置的格式将document输出成XML
		XMLWriter writer = new XMLWriter(new FileOutputStream("src/xml/book.xml"),format);
		writer.write(doc);
		writer.close();
	}
向指定位置添加新标签:
	public void add2() throws Exception{
		SAXReader reader = new SAXReader();
		Document doc = reader.read("src/xml/book.xml");
		
		Element book = (Element) doc.getRootElement().elements("书").get(1);
		List<Element> list = book.elements();
		
		Element price = DocumentHelper.createElement("售价");
		price.setText("999");
		
		list.add(2, price);
		
		OutputFormat format = OutputFormat.createPrettyPrint();
		format.setEncoding("UTF-8");
		
		XMLWriter writer = new XMLWriter(new FileOutputStream("src/xml/book.xml"),format);
		writer.write(doc);
		writer.close();
	}
删除标签:
	public void del() throws Exception{
		SAXReader reader = new SAXReader();
		Document doc = reader.read("src/xml/book.xml");
		
		Element root = doc.getRootElement();
		Element book = (Element)root.elements("书").get(1);
		Element price = book.element("售价");
		price.getParent().remove(price);
		
		OutputFormat format = OutputFormat.createPrettyPrint();
		format.setEncoding("UTF-8");
		
		XMLWriter writer = new XMLWriter(new FileOutputStream("src/xml/book.xml"),format);
		writer.write(doc);
		writer.close();
	}

更改标签内容:

	public void update() throws Exception{
		SAXReader reader = new SAXReader();
		Document doc = reader.read("src/xml/book.xml");
		
		Element root = doc.getRootElement();
		Element author = root.element("书").element("作者");
		author.setText("aaa");
		
		OutputFormat format = OutputFormat.createPrettyPrint();
		format.setEncoding("UTF-8");
		
		XMLWriter writer = new XMLWriter(new FileOutputStream("src/xml/book.xml"),format);
		writer.write(doc);
		writer.close();
	}

以上是三种解析XML的方法,下面是以上实例中所用到的xml:

<?xml version="1.0" encoding="UTF-8"?>
<书架>
  <书>
    <书名 name="test1">111</书名>
    <价格>222元</价格>
    <作者>aaa</作者>
  </书>
  <书>
    <书名 name="shu4">444</书名>
    <作者>bbb</作者>
    <价格>555元</价格>
  </书>
</书架>


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值