Java解析XML(一)——通过DOM方式解析XML

        XML是Extensible Markup Language(可扩展标记语言)的缩写,它不是编程语言。它是由w3c发布的,w3c发布它的初衷是想用它来进行Internet的文档信息传输,但这个愿望没有实现,发展到今天它主要用来表示一些数据之间的关系,我们通过它来记录应用程序的配置等信息。

       Java提供了DOM、SAX 、DOM4J、JDOM四种常用的解析方式来解析XML文件,其中DOM、SAX 是官方提供的方式,不需要下载jar包,DOM4J、JDOM 需要网上下载第三方jar包,这篇文章主要介绍如何通过DOM方式解析XML。

       (1)通过DOM方式解析XML大致可分为以下几个步骤
      
       1,创建一个DocumentBuilderFactory对象
        DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
       2,通过DocumentBuilderFactory对象获取一个DocumentBuilder对象
        DocumentBuilder db = dbf.newDocumentBuilder();
       3,通过DocumentBuilder的parse方法读取xml
       Document document = db.parse(String url);
       4,解析xml文件
        。。。。。。

      (2)xml中节点类型
       
       本例中用到的xml文件
<?xml version="1.0" encoding="UTF8"?>
<bookstore>
	<book id="1">
		<name>冰与火之歌</name>
		<author>乔治马丁</author>
		<year>2014</year>
		<price>89</price>
	</book>
	<book id="2">
		<name>安徒生童话</name>
		<year>2004</year>
		<price>77</price>
		<language>English</language>
	</book>
</bookstore>

       Java代码如下

     
package lowp.java.test;

import java.io.IOException;


import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;

import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.NamedNodeMap;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException;

import com.sun.org.apache.xalan.internal.xsltc.compiler.util.NodeType;

/**
 * 通过 DOM方式解析 XML 
 * @author Lowp
 */

public class Domtest {
	public static void main(String[] args){
		/**
		 * 1.创建一个DocumentBuilderFactory对象
		 */
		DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
		
		try {
			/**
			 * 2.通过DocumentBuilderFactory对象获取一个DocumentBuilder对象
			 */
			DocumentBuilder db = dbf.newDocumentBuilder();
			/**
			 * 3.通过DocumentBuilder的parse方法读取xml
			 */
			Document document = db.parse("books.xml");
			/**
			 * 4.解析xml文件
			 */
			
			/**
			 * (1)通过标签名获取所有节点并得到一个集合(本例中"book"节点)
			 */
			NodeList booksList = document.getElementsByTagName("book");
			/**
			 * 【1】通过booksList.getLength()获取booksList的长度
			 */
			System.out.println("一共有" + booksList.getLength() + "本书" + "\n");
			
			//(2)遍历节点集合,获取book节点的所有属性
			for (int i = 0; i <booksList.getLength(); i++) {
				System.out.println("==开始遍历第" + (i+1) + "本书:==");
				
				/**
				 * 【1】在不知道节点属性个数和属性名的情况下,用for循环遍历每一个节点,获取属性名和属性值
				 */
				
				//通过item(int index),获取对应的节点(NodeList的索引值从0开始)
				Node book = booksList.item(i);
				//获取book节点的所有属性的集合
				NamedNodeMap bookAttrs = book.getAttributes();
				//通过bookAttrs.getLength()获取属性个数
				System.out.println("第" + (i+1) + "本书,共有" + bookAttrs.getLength() + "个属性");
				
				for (int j = 0; j <bookAttrs.getLength(); j++) {
					//通过item(int index)获取book节点的每一个属性
					Node attr = bookAttrs.item(j);
					//获取属性名
					String name = attr.getNodeName();
					System.out.print("属性名:" + name + "--->");
					//获取属性值
					String value = attr.getNodeValue();
					System.out.println("属性值:" + value);
				}
				
				
				/**
				 * (3)获取book节点中所有子节点的集合
				 */
				NodeList childNodes = book.getChildNodes();
					
				/**
				 * 【1】遍历所有子节点,获取每一个节点的节点名和节点值
				 * 
				 * 注意 :java在解析xml节点时,空白区域是text类型,标签是eletemt类型,所以节点个数位9个
				 */
				//获取子节点的个数
				int sumNodes = childNodes.getLength();
				System.out.println("每一本书共有" + sumNodes + "个子节点");
				
				for (int k = 0; k < sumNodes; k++) {
					//区分节点的类型(text类型和eletemt类型)
					short nodeType = childNodes.item(k).getNodeType();
					//如果获得的节点是eletemt类型
					if(nodeType == Node.ELEMENT_NODE){
						//获取节点名
						String nodeName = childNodes.item(k).getNodeName();
						System.out.print("第" + (k+1) + "个节点的节点名是 :" + nodeName + "--->");
						
						/**
						 * 注意:不能直接通过getNodeValue()方法来获取节点的值,因为eletemt类型节点,
						 * 该方法的返回值是空。在解析节点时,系统会认为节点值是当前节点的一个子节点(text类型),
						 * 所以必须通过获取当前节点的字节点来获取其节点值
						 */
						//获取第一个子节点
						Node firstChildNodes = childNodes.item(k).getFirstChild();
						//获取节点值
						String nodeValue = firstChildNodes.getNodeValue();
						System.out.println("节点值是 :" + nodeValue);
					}
					
				}
				
				
//				/**
//				 * 【1】如果已知节点有且只有一个id属性,可根据该属性名获取其属性值
//				 */
//				//将book节点强制转换为element类型
//				Element element = (Element) booksList.item(i);
//				//通过属性名获取其对应的属性值
//				String s = element.getAttribute("id");
//				System.out.println("id的属性值为 :" + s);
				
				System.out.println("==第" + (i+1) + "本书遍历结束==" + "\n");
			}
			
			
		} catch (ParserConfigurationException e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		} catch (SAXException e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		} catch (IOException e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		}
		
		
		
	}

}

         
运行结果::
           
           
一共有2本书

==开始遍历第1本书:==
第1本书,共有1个属性
属性名:id--->属性值:1
每一本书共有9个子节点
第2个节点的节点名是 :name--->节点值是 :冰与火之歌
第4个节点的节点名是 :author--->节点值是 :乔治马丁
第6个节点的节点名是 :year--->节点值是 :2014
第8个节点的节点名是 :price--->节点值是 :89
==第1本书遍历结束==

==开始遍历第2本书:==
第2本书,共有1个属性
属性名:id--->属性值:2
每一本书共有9个子节点
第2个节点的节点名是 :name--->节点值是 :安徒生童话
第4个节点的节点名是 :year--->节点值是 :2004
第6个节点的节点名是 :price--->节点值是 :77
第8个节点的节点名是 :language--->节点值是 :English
==第2本书遍历结束==

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值