1:创建一个xml文件放在跟目录下面,这是一个test的新建项目
DOM解析是Java自带的,不用下载jar包什么的
我写的xml文件内容如下:
然后下面是主要代码:都有注释,慢慢看
package com.test;
import java.io.IOException;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import org.w3c.dom.Document;
import org.w3c.dom.NamedNodeMap;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException;
public class DomTest {
public static void main(String[] args) {
// 1、创建一个DocumentBuilderFactory的对象
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
// 2、创建一个DocumentBuilder的对象
try {
DocumentBuilder BU = dbf.newDocumentBuilder();
// 3、通过DocumentBuilder对象的parser方法加载books.xml文件到当前项目下
Document dou = BU.parse("MyXml.xml");
// 获取所有节点的集合
NodeList booklist = dou.getElementsByTagName("book");
// 获取所有的节点长度
System.out.println("一共有" + booklist.getLength() + "本书");
for (int i = 0; i < booklist.getLength(); i++) {
System.out.println("=================下面开始遍历第" + (i + 1)
+ "本书的内容=================");
// 未知节点属性的个数和属性名时:
// 通过 item(i)方法 获取一个book节点,nodelist的索引值从0开始
Node book = booklist.item(i);
NamedNodeMap attrs = book.getAttributes();
System.out.println("第 " + (i + 1) + "本书共有" + attrs.getLength()
+ "个属性");
for (int j = 0; j < attrs.getLength(); j++) {
Node attr = attrs.item(j);
// 获取属性名
System.out.print("属性名:" + attr.getNodeName());
// 获取属性值
System.out.println("--属性值" + attr.getNodeValue());
}
// 解析book节点的子节点
NodeList childNodes = book.getChildNodes();
// 遍历每个子节点的名字和值
for (int k = 0; k < childNodes.getLength(); k++) {
//下面这句话不明白的下面有解释:
if (childNodes.item(k).getNodeType() == Node.ELEMENT_NODE) {
// 获取了element类型节点的节点名
System.out.print("第" + (k+1) + "个节点的节点名:"
+ childNodes.item(k).getNodeName());
// 获取了element类型节点的节点值
System.out.println("--节点值是:"
+ childNodes.item(k).getFirstChild()
.getNodeValue());
}
}
}
} catch (ParserConfigurationException | SAXException | IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
}
if(childNodes.item(k).getNodeType() == Node.ELEMENT_NODE) 这句话可能会有一些人不明白,解释如下:
这句话是判断节点是否是元素节点:
元素(Element)和结点(Node)的区别,元素是一个小范围的定义,必须是含有完整信息的结点才是一个元素,例如<div>...</div>。但是一个结点不一定是一个元素,而一个元素一定是一个结点。
什么是node:
NODE是相对TREE这种数据结构而言的。TREE就是由NODE组成。这个部分你可以参考离散数学的树图。
什么是element:
ELEMENT则是XML里的概念,<xxx>就是元素,是XML中的数据的组成部分之一。
元素(Element)和结点(Node)的区别,元素是一个小范围的定义,必须是含有完整信息的结点才是一个元素,例如<div>...</div>。但是一个结点不一定是一个元素,而一个元素一定是一个结点。