前言:
当使用dom4j查询比较深的层次结构的节点 很麻烦!!!
之前写的几篇博客关于XML的读取都是通过一层一层查找下去,这样的代码冗余难看,也加重了负担,这个时候xPath技术就应运而生了。
老样子:三个问题:
xPath是什么?
xPath怎么用?
xPath运用场景?
xPath是什么?
主要是用于快速获取所需的节点对象。是针对XML结构而言。
xPath运用场景?
爬虫(爬取XML结构的节点内容)
我也百度了挺多内容,不过 关于xPath技术的内容不多,而且都比较老,但还是来学习一下吧。简单了解下 以后要是用到了再来学习。
有很多种方法调用xPath技术
这里也就来介绍用Dom4j来操作xPath。
因为Dom4j内置了jar包支持xPath技术。
Dom4j下载
问题:
dom4j-2.1.0源码下载后并没有找到支持xPath的jar包
而dom4j-1.6.1源码下载后有jaxen-1.1-beta-6.jar
这个才是关键
具体原因我也不知道……百度google半天没找到 原因 ,要是有人知道 麻烦告诉我一下,谢谢。
注意:
1. 采用xpath查找需要引入jaxen-xx-xx.jar,否则会 java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常。
2. 如果层次太深还是不建议用xPath,而是用迭代取出,不然会爆内存
jaxen-1.1-beta-6.jar
位置:dom4j-dom4j_1_6_1–>lib–>jaxen-1.1-beta-6.jar
导入:
前提先导入dom4j核心包:
dom4j-1.6.1.jar
或者dom4j-2.1.0.jar
都可以
然后导入jaxen-1.1-beta-6.jar
放入项目中的lib文件夹 然后右键build path–>add to build path
效果图:
使用xpath方法
List<Node> selectNodes("xpath表达式"<