XML是Extensible Markup Language(可扩展标记语言)的缩写,它不是编程语言。它是由w3c发布的,w3c发布它的初衷是想用它来进行Internet的文档信息传输,但这个愿望没有实现,发展到今天它主要用来表示一些数据之间的关系,我们通过它来记录应用程序的配置等信息。
Java提供了DOM、SAX 、DOM4J、JDOM四种常用的解析方式来解析XML文件,其中DOM、SAX 是官方提供的方式,不需要下载jar包,DOM4J、JDOM 需要网上下载第三方jar包,这篇文章主要介绍如何通过DOM方式解析XML。
(1)通过DOM方式解析XML大致可分为以下几个步骤
1,创建一个DocumentBuilderFactory对象
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
2,通过DocumentBuilderFactory对象获取一个DocumentBuilder对象
DocumentBuilder db = dbf.newDocumentBuilder();
3,通过DocumentBuilder的parse方法读取xml
Document document = db.parse(String url);
4,解析xml文件
。。。。。。
(2)xml中节点类型
本例中用到的xml文件
<?xml version="1.0" encoding="UTF8"?>
<bookstore>
<book id="1">
<name>冰与火之歌</name>
<author>乔治马丁</author>
<year>2014</year>
<price>89</price>
</book>
<book id="2">
<name>安徒生童话</name>
<year>2004</year>
<price>77</price>
<language>English</language>
</book>
</bookstore>
Java代码如下
package lowp.java.test;
import java.io.IOException;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.NamedNodeMap;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException;
import com.sun.org.apache.xalan.internal.xsltc.compiler.util.NodeType;
/**
* 通过 DOM方式解析 XML
* @author Lowp
*/
public class Domtest {
public static void main(String[] args){
/**
* 1.创建一个DocumentBuilderFactory对象
*/
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
try {
/**
* 2.通过DocumentBuilderFactory对象获取一个DocumentBuilder对象
*/
DocumentBuilder db = dbf.newDocumentBuilder();
/**
* 3.通过DocumentBuilder的parse方法读取xml
*/
Document document = db.parse("books.xml");
/**
* 4.解析xml文件
*/
/**
* (1)通过标签名获取所有节点并得到一个集合(本例中"book"节点)
*/
NodeList booksList = document.getElementsByTagName("book");
/**
* 【1】通过booksList.getLength()获取booksList的长度
*/
System.out.println("一共有" + booksList.getLength() + "本书" + "\n");
//(2)遍历节点集合,获取book节点的所有属性
for (int i = 0; i <booksList.getLength(); i++) {
System.out.println("==开始遍历第" + (i+1) + "本书:==");
/**
* 【1】在不知道节点属性个数和属性名的情况下,用for循环遍历每一个节点,获取属性名和属性值
*/
//通过item(int index),获取对应的节点(NodeList的索引值从0开始)
Node book = booksList.item(i);
//获取book节点的所有属性的集合
NamedNodeMap bookAttrs = book.getAttributes();
//通过bookAttrs.getLength()获取属性个数
System.out.println("第" + (i+1) + "本书,共有" + bookAttrs.getLength() + "个属性");
for (int j = 0; j <bookAttrs.getLength(); j++) {
//通过item(int index)获取book节点的每一个属性
Node attr = bookAttrs.item(j);
//获取属性名
String name = attr.getNodeName();
System.out.print("属性名:" + name + "--->");
//获取属性值
String value = attr.getNodeValue();
System.out.println("属性值:" + value);
}
/**
* (3)获取book节点中所有子节点的集合
*/
NodeList childNodes = book.getChildNodes();
/**
* 【1】遍历所有子节点,获取每一个节点的节点名和节点值
*
* 注意 :java在解析xml节点时,空白区域是text类型,标签是eletemt类型,所以节点个数位9个
*/
//获取子节点的个数
int sumNodes = childNodes.getLength();
System.out.println("每一本书共有" + sumNodes + "个子节点");
for (int k = 0; k < sumNodes; k++) {
//区分节点的类型(text类型和eletemt类型)
short nodeType = childNodes.item(k).getNodeType();
//如果获得的节点是eletemt类型
if(nodeType == Node.ELEMENT_NODE){
//获取节点名
String nodeName = childNodes.item(k).getNodeName();
System.out.print("第" + (k+1) + "个节点的节点名是 :" + nodeName + "--->");
/**
* 注意:不能直接通过getNodeValue()方法来获取节点的值,因为eletemt类型节点,
* 该方法的返回值是空。在解析节点时,系统会认为节点值是当前节点的一个子节点(text类型),
* 所以必须通过获取当前节点的字节点来获取其节点值
*/
//获取第一个子节点
Node firstChildNodes = childNodes.item(k).getFirstChild();
//获取节点值
String nodeValue = firstChildNodes.getNodeValue();
System.out.println("节点值是 :" + nodeValue);
}
}
// /**
// * 【1】如果已知节点有且只有一个id属性,可根据该属性名获取其属性值
// */
// //将book节点强制转换为element类型
// Element element = (Element) booksList.item(i);
// //通过属性名获取其对应的属性值
// String s = element.getAttribute("id");
// System.out.println("id的属性值为 :" + s);
System.out.println("==第" + (i+1) + "本书遍历结束==" + "\n");
}
} catch (ParserConfigurationException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} catch (SAXException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
}
运行结果::
一共有2本书
==开始遍历第1本书:==
第1本书,共有1个属性
属性名:id--->属性值:1
每一本书共有9个子节点
第2个节点的节点名是 :name--->节点值是 :冰与火之歌
第4个节点的节点名是 :author--->节点值是 :乔治马丁
第6个节点的节点名是 :year--->节点值是 :2014
第8个节点的节点名是 :price--->节点值是 :89
==第1本书遍历结束==
第1本书,共有1个属性
属性名:id--->属性值:1
每一本书共有9个子节点
第2个节点的节点名是 :name--->节点值是 :冰与火之歌
第4个节点的节点名是 :author--->节点值是 :乔治马丁
第6个节点的节点名是 :year--->节点值是 :2014
第8个节点的节点名是 :price--->节点值是 :89
==第1本书遍历结束==
==开始遍历第2本书:==
第2本书,共有1个属性
属性名:id--->属性值:2
每一本书共有9个子节点
第2个节点的节点名是 :name--->节点值是 :安徒生童话
第4个节点的节点名是 :year--->节点值是 :2004
第6个节点的节点名是 :price--->节点值是 :77
第8个节点的节点名是 :language--->节点值是 :English
==第2本书遍历结束==
第2本书,共有1个属性
属性名:id--->属性值:2
每一本书共有9个子节点
第2个节点的节点名是 :name--->节点值是 :安徒生童话
第4个节点的节点名是 :year--->节点值是 :2004
第6个节点的节点名是 :price--->节点值是 :77
第8个节点的节点名是 :language--->节点值是 :English
==第2本书遍历结束==