xml文件解析

本文详细介绍了XML解析中的DOM解析与SAX解析的区别及应用,同时提供了SAX解析的代码示例,并展示了如何利用SAX解析器进行文档解析、查找元素、添加元素、修改元素、删除元素以及XPath的基本语法和应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >


XML解析:
两种:dom解析:一次解析不用重复解析。可以很方便对xml进行增删改查,缺点:每个节点都是对象,dom解析占用内存很大。

      sax解析:逐步扫描整个xml文档在扫描过程中对于事件会去调用事件处理器中的对应方法处理事件,
               sax解析非常快,sax占用内存很少。只能读取数据,不能对xml中的数据进行增删改操作。

 

sax 解析代码:

package com.itheima;

import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;

import org.xml.sax.Attributes;
import org.xml.sax.ContentHandler;
import org.xml.sax.Locator;
import org.xml.sax.SAXException;
import org.xml.sax.XMLReader;
import org.xml.sax.helpers.DefaultHandler;


public class SaxParseXml {
 public static void main(String[] args) throws Exception {
  //使用SAXParserFactory获得创建SAX的工厂
  SAXParserFactory saxf= SAXParserFactory.newInstance();
  //获取SAX解析工厂得到解析器对象
  SAXParser sp = saxf.newSAXParser();
  //通过解析器对象得到一个xml的读取器
  XMLReader xmlReader = sp.getXMLReader();
  //设置读取器的事件处理器
  xmlReader.setContentHandler(new MyContentHandler2());
  //解析xml文件
  xmlReader.parse("book.xml");
 }
}
class MyContentHandler2 extends DefaultHandler{
 private boolean flag = false;
 private int count = 0;
 @Override
 public void startElement(String uri, String localName, String qName,
   Attributes attributes) throws SAXException {
  if("书名".equals(qName)){
   flag = true;
   count ++;
  }
 }
 @Override
 public void characters(char[] ch, int start, int length) throws SAXException {
  if(flag && count == 2)
  System.out.println(new String(ch,start,length));
 };
 public void endElement(String uri, String localName, String qName)
   throws SAXException {
  if("书名".equals(qName)){
   flag = false;
  }
 }
}
class MyContentHandler implements ContentHandler{
 private boolean flag = false;
 private int count = 0;
 @Override
 public void startDocument() throws SAXException {
  System.out.println("开始解析book.xml文件");
 }
 @Override
 public void endDocument() throws SAXException {
  System.out.println("book.xml解析结束");
 }
 @Override
 public void startElement(String uri, String localName, String qName,
   Attributes atts) throws SAXException {
  System.out.println(uri+qName);
  if("书名".equals(qName)){
   flag = true;
   count++;
  }
 }
 @Override
 public void characters(char[] ch, int start, int length)
   throws SAXException {
  if(flag && count == 2){
   String bookName = new String(ch, start, length);
   System.out.println(bookName);
  }
 }
 @Override
 public void endElement(String uri, String localName, String qName)
   throws SAXException {
  System.out.println(uri+qName);
  if("书名".equals(qName)){
   flag = false;
  }
 }

 @Override
 public void setDocumentLocator(Locator locator) {
  
 }
 @Override
 public void startPrefixMapping(String prefix, String uri)
   throws SAXException {
  // TODO Auto-generated method stub
  
 }

 @Override
 public void endPrefixMapping(String prefix) throws SAXException {
  // TODO Auto-generated method stub
  
 }

 

 @Override
 public void ignorableWhitespace(char[] ch, int start, int length)
   throws SAXException {
  // TODO Auto-generated method stub
  
 }

 @Override
 public void processingInstruction(String target, String data)
   throws SAXException {
  // TODO Auto-generated method stub
  
 }

 @Override
 public void skippedEntity(String name) throws SAXException {
  // TODO Auto-generated method stub
  
 }
 
}

 doc解析:

doc解析:
     1、查找元素:
      /**
查找
**/
@Test
public  void getElement() throws Exception{
//构造sax解析器
SAXReader sax = new SAXReader();
//得到documet对象
Document document = sax.read("book.xml");
//得到root根节点
Element root = document.getRootElement();

System.out.println(root);
//获得书名元素
Element el = root.element("书").element("书名");
System.out.println(el.getText());


//遍历所以书名的元素
@SuppressWarnings("unchecked")
List<Element> elements = root.elements("书");
Element book2Name = elements.get(1).element("书名");
System.out.println(book2Name.getText());


}
/**
* 查找属性
* @throws Exception
*/
@Test
public  void getAttribution() throws Exception{
//构造Sax解析器
SAXReader reader = new SAXReader();
//获得document对象
Document document = reader.read("book.xml");
//获得根节点
Element note = document.getRootElement();
//获得元素
Element book = note.element("书");
//获得元素的属性
Attribute bookAttr = book.attribute(0);
//获得元素的所有属性
@SuppressWarnings({ "unused", "unchecked" })
List<Attribute> bookAttrs = book.attributes();
String name = bookAttr.getName();
System.out.println(name+":"+bookAttr.getValue());
}
      2、添加元素:注意要把元素写回 xml文件里
      public void addElement() throws Exception {
//构造sax解析器
SAXReader sax = new SAXReader();
//得到documet对象
Document document = sax.read("book.xml");
//得到root根节点
Element root = document.getRootElement();
//获取父节点
Element shu = root.element("书");
//2.用DocumentHelper的createElement创建特价节点
Element tejia = DocumentHelper.createElement("特价");
tejia.setText("99.9");
//把元素写的父节点上
shu.add(tejia);
//把元素写回xml里
//方法一:
/*XMLWriter xmlWriter = new XMLWriter(new FileWriter("book.xml"),OutputFormat.createPrettyPrint());
xmlWriter.write(document);
xmlWriter.close();*/
//方法二:
Writer write = new OutputStreamWriter(new FileOutputStream("book.xml"), "utf-8");
document.write(write);
write.flush();
write.close();

}
     3、 修改元素
        public void updateElement() throws Exception {
//构造sax解析器
SAXReader sax = new SAXReader();
//得到documet对象
Document document = sax.read("book.xml");
//得到root根节点
Element root = document.getRootElement();
//得到要修改的元素
Element tejia = root.element("书").element("特价");
tejia.setText("12");
//数据回写
Writer write = new OutputStreamWriter(new FileOutputStream("book.xml"), "utf-8");
document.write(write);
write.flush();
write.close();
     }
     4、 删除元素


     public void deleteElement() throws Exception{
//构造解析器
SAXReader sax = new SAXReader();
//获取document对象
Document doc = sax.read("book.xml");
//得到root节点
Element root = doc.getRootElement();
//得到要删除的节点
Element tejia = root.element("书").element("特价");
tejia.getParent().remove(tejia);
//写回xml里
Writer writer = new OutputStreamWriter(new FileOutputStream("book.xml"),"utf-8");
doc.write(writer);
writer.flush();
writer.close();

}

 xpath
   1、xpath 的基本语法:
       a)基本的XPath语法类似于在一个文件系统中定位文件,如果路径以斜线 / 开始, 那么该路径就表示到一个元素的绝对路径   /AAA
       b)如果路径以双斜线 // 开头, 则表示选择文档中所有满足双斜线//之后规则的元素(无论层级 关系) //BBB  
       c)星号 * 表示选择所有由星号之前的路径所定位的元素 /AAA/CCC/DDD/*
       d)方块号里的表达式可以进一步的指定元素, 其中数字表示元素在选择集里的位置, 而last()函 数则表示选择集中的最后一个元素./AAA/BBB[1] and /AAA/BBB[last()]
       e)选择所有的id属性 //@id //BBB[@id]
       f)属性的值可以被用来作为选择的准则, normalize-space函数删除了前部和尾部的空格, 并且 把连续的空格串替换为一个单一的空格 //BBB[@id='b1'] and //BBB[normalize-space(@name)='bbb']
       g)count()函数可以计数所选元素的个数 //*[count(BBB)=2] 选择含有2个BBB子元素的元素


      public void learnXpath() throws Exception{
//获取解析器
SAXReader sax = new SAXReader();
//获得document
Document doc =sax.read("book.xml");
//获取根元素
Element root = doc.getRootElement();
//匹配要获得的元素
//List<Element> els = root.selectNodes("/书架/书");
//List<Element> els = root.selectNodes("//书");
//List<Element> els = root.selectNodes("//书/*");
//List<Element> els = root.selectNodes("//书/*[2]");
List<Element> els = root.selectNodes("//书[@id]");
System.out.println(els.get(0).getName());

}

book.xml:

<?xml version="1.0" encoding="gb2312"?>
<书架>
 <书>
  <书名>Java就业培训教程</书名>
  <作者>张孝祥</作者>
  <售价>39.00元</售价>
 </书>
 <书>
  <书名>JavaScript网页开发</书名>
  <作者>张孝祥</作者>
  <售价>28.00元</售价>
 </书>
</书架>

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值