dom4j解析XML

最新推荐文章于 2025-05-03 13:33:59 发布

evangel_z

最新推荐文章于 2025-05-03 13:33:59 发布

阅读量1.1k

点赞数

分类专栏： J2EE 文章标签： hashmap string iterator xml null exception

J2EE 专栏收录该内容

37 篇文章

订阅专栏

包括三个文件：studentInfo.xml(待解析的xml文件), Dom4jReadExmple.java(解析的主要类), TestDom4jReadExmple.java(测试解析的结果) （由于使用csdn blog自带的代码粘贴工具会朝里加入一些"..."字符，虽然利于查看，但是不利于把代码copy出来运行，而亲自运行代码对程序员来说是很重要的，故没有使用csdn blog自带的代码粘贴工具来插入代码，而是用着用直白的方式）：

studentInfo.xml

<?xml version="1.0" encoding="gb2312"?>
<students>
    <student age="25"><!--如果没有age属性，默认的为20-->
        <name>崔卫兵</name>
        <college>PC学院</college>
        <telephone>62354666</telephone>
        <notes>男,1982年生,硕士，现就读于北京邮电大学</notes>
    </student>
    <student>
        <name>cwb</name>
        <college leader="学院领导">PC学院</college><!--如果没有leader属性，默认的为leader-->
        <telephone>62358888</telephone>
        <notes>男,1987年生,硕士，现就读于中国农业大学</notes>
    </student>
    <student age="45">
        <name>xxxxx</name>
        <college leader="">xxx学院</college>
        <telephone>66666666</telephone>
        <notes>注视中，注释中</notes>
    </student>
    <student age="">
        <name>lxx</name>
        <college>yyyy学院</college>
        <telephone>88888888</telephone>
        <notes>注视中111，注释中222</notes>
    </student>
</students>

Dom4jReadExmple.java

package dom4jExample.read;

import java.io.File;
import java.util.HashMap;
import java.util.Iterator;

import org.dom4j.Attribute;
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;
/**
 * 利用dom4j进行XML编程
 * @author cuiweibing
 * @since 2007.8.10
 */
public class Dom4jReadExmple {
 /**
  * 遍历整个XML文件，获取所有节点的值与其属性的值，并放入HashMap中
  * @param filename String 待遍历的XML文件（相对路径或者绝对路径）
  * @param hm       HashMap 存放遍历结果，格式：<nodename,nodevalue>或者<nodename+attrname,attrvalue>
  */
 public void iterateWholeXML(String filename,HashMap<String,String> hm){
  SAXReader saxReader = new SAXReader();
  try {
   Document document = saxReader.read(new File(filename));
   Element root = document.getRootElement();
//   用于记录学生编号的变量
   int num=-1;
   //遍历根结点（students）的所有孩子节点（肯定是student节点）
         for ( Iterator iter = root.elementIterator(); iter.hasNext(); ) {
             Element element = (Element) iter.next();
             num++;
    // 获取person节点的age属性的值
             Attribute ageAttr=element.attribute("age");
    if(ageAttr!=null){
     String age = ageAttr.getValue();
     if (age != null&&!age.equals("")) {
      hm.put(element.getName() + "-"+ageAttr.getName()+ num, age);
     } else {
      hm.put(element.getName() + "-" +ageAttr.getName()+ num, "20");
     }
    }else{
     hm.put(element.getName() + "-age"+ num, "20");
    }
             //遍历student结点的所有孩子节点（即name，college，telphone，notes），并进行处理
             for ( Iterator iterInner = element.elementIterator(); iterInner.hasNext(); ) {
              Element elementInner = (Element) iterInner.next();
              if(elementInner.getName().equals("college")){
               hm.put(elementInner.getName()+ num, elementInner.getText());
               //获取college节点的leader属性的值
               Attribute leaderAttr=elementInner.attribute("leader");
               if(leaderAttr!=null){
       String leader = leaderAttr.getValue();
       if (leader != null&&!leader.equals("")) {
        hm.put(elementInner.getName() + "-"+leaderAttr.getName()+ num, leader);
       } else {
        hm.put(elementInner.getName() + "-" +leaderAttr.getName()+ num, "leader");
       }
               }else {
       hm.put(elementInner.getName() + "-leader"+ num, "leader");
      }
              }else{
               hm.put(elementInner.getName()+ num, elementInner.getText());
              }
             }
         }

  } catch (DocumentException e) {
   // TODO Auto-generated catch block
   e.printStackTrace();
  }
 }
}

TestDom4jReadExmple.java

package dom4jExample.read;

import java.util.HashMap;

/**
 * 测试Dom4jReadExmple解析的情况
 * @author cuiweibing
 * @since 2007.8.10
 */
public class TestDom4jReadExmple {
 public static void main(String[] args) {
     try{
       //获取解析完后的解析信息
       HashMap<String,String> hashMap;
       Dom4jReadExmple drb=new Dom4jReadExmple();
       //遍历整个XML文件
       hashMap = new HashMap<String,String>();
       drb.iterateWholeXML("studentInfo.xml", hashMap);
       System.out.println("姓名/t年龄/t学院/t学院领导/t电话/t/t备注");
       for(int i=0;i<hashMap.size();i+=6){
         int j=i/6;
         System.out.print(hashMap.get("name"+j)+"/t");
         System.out.print(hashMap.get("student-age"+j)+"/t");
         System.out.print(hashMap.get("college"+j)+"/t");
         System.out.print(hashMap.get("college-leader"+j)+"/t");
         System.out.print(hashMap.get("telephone"+j)+"/t");
         System.out.println(hashMap.get("notes"+j)+"/t");
       }
     }catch(Exception ex){
       ex.printStackTrace();
     }
   }
}

运行结果
姓名年龄学院学院领导电话备注
崔卫兵 25 PC学院 leader 62354666 男,1982年生,硕士，现就读于北京邮电大学
cwb 20 PC学院学院领导 62358888 男,1987年生,硕士，现就读于中国农业大学
xxxxx 45 xxx学院 leader 66666666 注视中，注释中
lxx 20 yyyy学院 leader 88888888 注视中111，注释中222

附：主要接口都在org.dom4j这个包里定义：

*Attribute*	Attribute定义了XML的属性
*Branch*	Branch为能够包含子节点的节点如XML元素(Element)和文档(Docuemnts)定义了一个公共的行为，
*CDATA*	CDATA 定义了XML CDATA 区域
*CharacterData*	CharacterData是一个标识借口，标识基于字符的节点。如CDATA，Comment, Text.
*Comment*	Comment 定义了XML注释的行为
*Document*	定义了XML文档
*DocumentType*	DocumentType 定义XML DOCTYPE声明
*Element*	Element定义XML 元素
*ElementHandler*	ElementHandler定义了 Element 对象的处理器
*ElementPath*	被 ElementHandler 使用，用于取得当前正在处理的路径层次信息
*Entity*	Entity定义 XML entity
*Node*	Node为所有的dom4j中XML节点定义了多态行为
*NodeFilter*	NodeFilter 定义了在dom4j节点中产生的一个滤镜或谓词的行为（predicate）
*ProcessingInstruction*	ProcessingInstruction 定义 XML 处理指令.
*Text*	Text 定义XML 文本节点.
*Visitor*	Visitor 用于实现Visitor模式.
*XPath*	XPath 在分析一个字符串后会提供一个XPath 表达式