dom4j简单学习 element和node的区别

本文介绍了dom4j库在处理XML时的操作,包括DOM4J解析XML的示例,利用XPath选取节点,以及如何生成和修改XML文件。同时提到了与SAX和DOM的比较,以及在处理大型XML文件时的效率问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

分享一下我老师大神的人工智能教程!零基础,通俗易懂!http://blog.youkuaiyun.com/jiangjunshow

也欢迎大家转载本篇文章。分享知识,造福人民,实现我们中华民族伟大复兴!

               

使用dom4j解析处理html时,遇到一些麻烦的问题:


基中必须要使用XPath取得节点,有个命名空间的问题,需要如下处理:
HashMap<String, String> gm = new HashMap<String, String>();
gm.put("xmlns", "http://www.w3.org/1999/xhtml");
Document rootDoc = DocumentHelper.parseText(s);
XPath xpathTable = DocumentHelper
.createXPath("//xmlns:table[@class=\"tableList\"]");
xpathTable.setNamespaceURIs(gm);
List<Node> tables = xpathTable.selectNodes(rootDoc);

现在取出来是Node对象(比如一个table),再往下取时,再用node1.selectNodes会取不到东西,可能还是因为命名空间的麻烦问题,所以最好转为Element,就很容易了,element1.elements("tr"),就可以方便地循环了,比较奇怪的是转换为Element的方法居然是强转-_-!
Element table1 = (Element) tables.get(0); // 第一个表格
由此可以这样理解Node和Element,Node是节点,一个属性、一段文字、一个注释等都是节点,而Element是元素,是比较完整的一个xml的元素,即我们口头上说的xml“结点”(此处故意使用“结”字,以示与“节点”Node区别),呵呵……


dom4j帮助文档在dom4j-1.6.1/docs/guide.html文件里面,全部是英文,但是基本上应该能看懂。

1、  四种操作xml的方式:SAX,DOM,JDOM,DOM4J.

2、  DOM(Document Object Model):意思是把整个xml做为一个整体对象,直接全部放到内存里面,不管xml文件有多大;

3、  SAX=Sample API for XML:假如xml文件有2G,用第一种方式,是很困难的,SAX用的是一种类似流媒体方式进行的。

DOM和SAX是java的API,处理xml文件的时候,相对来说是比较困难的,于是出现了下面两种框架,包装了上面两个框架。

4、  JDOM:

5、  DOM4J:

6、  利用DOM4J解析xml文件(读取所有的属性节点)。

Document可以理解为整个文档对象

取root节点。Document.getRootElement()返回的是一个Element(元素)

7、  理解运用xpath,path就是路径,xpath在xml文件里面找到特定的节点。

Document.selectNodes(“//hibernate-mapping/class/property”)  //其中hibenate-mapping是根节点。做变org.dom4j.Node对象返回的。

Document.selectSingleNodes(“//hibernate-mapping/class/property”)//只拿第一个。

基中@name是property的属性名valueOf是拿出name的值;

需要加入DOM4J里面的jaxen包

8、  DOM4J的生成xml文件

9、  用FileWriter生成xml文件的时候,可能没有格式,可以用XMLWriter类,这样自动进行美化。

10、  DOM4J修改xml文件;很少用。

11、  自动生成代码往往用的是:freemarker或velocity,这是常用的。用dom4j生成也很少用。

12、  怎么用表里面的结构生成xml文件。

13、 JavaDB

a)       Properties对象:可以理解为一个表格对应key,value

14、  Databasemetadata,可以能过这个JDK类,读取数据库的表结构,通过这个表结构做一些自己的事情。(熟悉用法)通过JDK文档和google学习

15、   元数据就是数据的数据,用来描述数据的数据。

16、   DWR,对Ajax框架封住得比较好,是类和java的结合。


dom4j学习实例:

[java]  view plain copy
  1. package hb.dom4j;  
  2.   
  3. import java.io.FileWriter;  
  4. import java.io.IOException;  
  5. import java.util.Iterator;  
  6. import java.util.List;  
  7.   
  8. import org.dom4j.Attribute;  
  9. import org.dom4j.Document;  
  10. import org.dom4j.DocumentException;  
  11. import org.dom4j.DocumentHelper;  
  12. import org.dom4j.Element;  
  13. import org.dom4j.Node;  
  14. import org.dom4j.io.OutputFormat;  
  15. import org.dom4j.io.SAXReader;  
  16. import org.dom4j.io.XMLWriter;  
  17.   
  18. public class MyJdomReaderXML {  
  19.     public Document parse(String string) throws DocumentException {  
  20.         SAXReader reader = new SAXReader();  
  21.         Document document = reader.read(string);  
  22.         return document;  
  23.     }  
  24.   
  25.     public void bar(Document document) throws DocumentException {  
  26.           
  27.         Element root = document.getRootElement();//获得根节点;  
  28.         //进行迭代;读取根节点下的所有节点和子节点下的所有节点  
  29.         for (Iterator i = root.elementIterator(); i.hasNext();) {  
  30.             Element element = (Element) i.next();  
  31.             System.out.println(element.getName());  
  32.             for (Iterator j = element.elementIterator(); j.hasNext();) {  
  33.                 System.out.println(((Element) j.next()).getName());  
  34.             }  
  35.         }  
  36.           
  37.         //读取节点名为foo的所有子节点  
  38.         for (Iterator i = root.elementIterator("foo"); i.hasNext();) {  
  39.             Element foo = (Element) i.next();  
  40.             System.out.println(foo.getName());  
  41.         }  
  42.           
  43.         //读取根节点的所有属性  
  44.         for (Iterator i = root.attributeIterator(); i.hasNext();) {  
  45.             Attribute attribute = (Attribute) i.next();  
  46.             System.out.println(attribute.getName());  
  47.         }  
  48.     }  
  49.       
  50.     /* 
  51.      * 可以根据节点名字读取节点,也可以读取节点里的key和value 
  52.      */  
  53.     public void readNodes(Document document) {  
  54.         List list = document.selectNodes( "//foo/bar" );   //foo为根节点,获得根节点下的bar节点  
  55.         Node node = document.selectSingleNode( "//foo/bar/author" );  //获得名为author的第一 节点  
  56.         String name = node.valueOf( "@name" ); //获得节点名属性名为name的value  
  57.     }  
  58.       
  59.     /* 
  60.      * 如果xml文件很大的情况下,用上面的方法很费时,这样 可以用递归遍历整个xml文件 
  61.      */  
  62.     public void treeWalk(Document document) {  
  63.         treeWalk(document.getRootElement());  
  64.     }  
  65.   
  66.     /* 
  67.      * 递归调用,传递每一个父节点做为参数 
  68.      */  
  69.     public void treeWalk(Element element) {  
  70.         for (int i = 0, size = element.nodeCount(); i < size; i++) {  
  71.             Node node = element.node(i);  
  72.             if (node instanceof Element) {//如果node实现了Element接口,那么就表示node是一个节点。再递归  
  73.                 treeWalk((Element) node);  
  74.                 System.out.println(((Element) node).getName()+":"+node.valueOf("@name"));  
  75.             } else {//如果没有实现Element接口,那么就表示这个node不是节点了,输出节点等操作;  
  76.             }  
  77.         }  
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值