JAVA解析XML文件之DOM解析

最新推荐文章于 2021-02-12 13:07:23 发布

原创最新推荐文章于 2021-02-12 13:07:23 发布 · 438 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#java #解析 #DOM #xml

Javaweb开发专栏收录该内容

19 篇文章

订阅专栏

本文介绍了一个使用Java DOM解析XML文件的示例程序。该程序读取XML文件中的书籍信息，并展示了如何获取节点属性及子节点的数据。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1：创建一个xml文件放在跟目录下面，这是一个test的新建项目

DOM解析是Java自带的，不用下载jar包什么的

我写的xml文件内容如下：

然后下面是主要代码：都有注释，慢慢看

package com.test;
import java.io.IOException;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import org.w3c.dom.Document;
import org.w3c.dom.NamedNodeMap;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException;

public class DomTest {

	public static void main(String[] args) {
		// 1、创建一个DocumentBuilderFactory的对象
		DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
		// 2、创建一个DocumentBuilder的对象
		try {
			DocumentBuilder BU = dbf.newDocumentBuilder();
			// 3、通过DocumentBuilder对象的parser方法加载books.xml文件到当前项目下
			Document dou = BU.parse("MyXml.xml");
			// 获取所有节点的集合
			NodeList booklist = dou.getElementsByTagName("book");
			// 获取所有的节点长度
			System.out.println("一共有" + booklist.getLength() + "本书");
			for (int i = 0; i < booklist.getLength(); i++) {
				System.out.println("=================下面开始遍历第" + (i + 1)
						+ "本书的内容=================");
				// 未知节点属性的个数和属性名时:
				// 通过 item(i)方法 获取一个book节点，nodelist的索引值从0开始
				Node book = booklist.item(i);
				NamedNodeMap attrs = book.getAttributes();
				System.out.println("第 " + (i + 1) + "本书共有" + attrs.getLength()
						+ "个属性");
				for (int j = 0; j < attrs.getLength(); j++) {
					Node attr = attrs.item(j);
					// 获取属性名
					System.out.print("属性名：" + attr.getNodeName());
					// 获取属性值
					System.out.println("--属性值" + attr.getNodeValue());
				}
				// 解析book节点的子节点
				NodeList childNodes = book.getChildNodes();
				// 遍历每个子节点的名字和值
				for (int k = 0; k < childNodes.getLength(); k++) {

                                   //下面这句话不明白的下面有解释：
					if (childNodes.item(k).getNodeType() == Node.ELEMENT_NODE) {
						// 获取了element类型节点的节点名
						System.out.print("第" + (k+1) + "个节点的节点名："
								+ childNodes.item(k).getNodeName());
						// 获取了element类型节点的节点值
						System.out.println("--节点值是："
								+ childNodes.item(k).getFirstChild()
										.getNodeValue());
					}
				}
			}
		} catch (ParserConfigurationException | SAXException | IOException e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		}
	}
}

if(childNodes.item(k).getNodeType() == Node.ELEMENT_NODE)  这句话可能会有一些人不明白,解释如下：

这句话是判断节点是否是元素节点：

元素(Element)和结点(Node)的区别，元素是一个小范围的定义，必须是含有完整信息的结点才是一个元素，例如<div>...</div>。但是一个结点不一定是一个元素，而一个元素一定是一个结点。
什么是node：


NODE是相对TREE这种数据结构而言的。TREE就是由NODE组成。这个部分你可以参考离散数学的树图。
 
什么是element：
 
ELEMENT则是XML里的概念，<xxx>就是元素，是XML中的数据的组成部分之一。
 
元素(Element)和结点(Node)的区别，元素是一个小范围的定义，必须是含有完整信息的结点才是一个元素，例如<div>...</div>。但是一个结点不一定是一个元素，而一个元素一定是一个结点。