一、生成XML文件
public static String authcode(Document doc, BusinessServer businessServer)
{
if (doc == null) {
doc = DocumentHelper.createDocument();
}
doc.setXMLEncoding("gbk");
Element imccElement = doc.addElement("imcc");
Element commandElement = addElement(imccElement, "command");
Element codeElement = addElement(commandElement, "code");
codeElement.setText(businessServer.getHeader().getCommand());
Element requestElement = addElement(imccElement, "request");
Element imtypeElement = addElement(requestElement, "im-type");
imtypeElement.setText(businessServer.getHeader().getImtype()+"");
Element hosttelElement = addElement(requestElement, "host-tel");
hosttelElement.setText(businessServer.getHeader().getHosttel());
Element msgflagElement = addElement(requestElement, "msg-flag");
msgflagElement.setText(businessServer.getHeader().getMsgflag()+"");
return doc.asXML();
}
生成的代码示例
<imcc>
<span style="white-space:pre"> </span><command>
<span style="white-space:pre"> </span><code>getauthcode</code>
<span style="white-space:pre"> </span></command>
<span style="white-space:pre"> </span><request>
<span style="white-space:pre"> </span><im-type>4</im-type>
<span style="white-space:pre"> </span><host-tel>10004</host-tel>
<span style="white-space:pre"> </span><msg-flag>162</msg-flag>
<span style="white-space:pre"> </span></request>
</imcc>
解释测试代码
import java.io.ByteArrayInputStream;
import java.io.UnsupportedEncodingException;
import java.util.List;
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.DocumentHelper;
import org.dom4j.Node;
import org.dom4j.io.SAXReader;
public class domparse {
private static SAXReader reader = new SAXReader();
public static void main(String str[]){
String xml ="<?xml version=\"1.0\" encoding=\"gbk\"?>"
+"<imcc><result><code>0</code><reason></reason></result><response>"
+"<authorization-code>0652b8865e5a10ed289f3f458d92c56e4dfb8cb6389aecdd962c25c6e831ae78</authorization-code></response></imcc>";
System.out.println("xml is: "+xml);
Document doc = DocumentHelper.createDocument();
String tag="authorization-code";
String result=null;
try {
result=analyzeModel(doc,xml,tag);
} catch (UnsupportedEncodingException | DocumentException e) {
e.printStackTrace();
}
System.out.println("result: "+result);
}
public static String analyzeModel(Document doc, String str, String tag)
throws UnsupportedEncodingException, DocumentException
{
String xspmc = null;
reader.setEncoding("gbk");
doc = reader.read(new ByteArrayInputStream(str.getBytes("gbk")));
List<Node> allNodeList = doc.selectNodes("//*");
for (Node xmlTitleName : allNodeList) {
if (xmlTitleName.getName().equals(tag)) {
xspmc = xmlTitleName.getStringValue();
}
}
return xspmc;
}
}
xml is: <?xml version="1.0" encoding="gbk"?><imcc><result><code>0</code><reason></reason></result><response><authorization-code>0652b8865e5a10ed289f3f458d92c56e4dfb8cb6389aecdd962c25c6e831ae78</authorization-code></response></imcc>result: 0652b8865e5a10ed289f3f458d92c56e4dfb8cb6389aecdd962c25c6e831ae78
二、注意一定要导入两个包
dom4j-1.6.1.jar-306 KB
jaxen-1.1-beta-6.jar-238 KB
使用dom4j解析XML时,要快速获取某个节点的数据,使用XPath是个不错的方法,dom4j的快速手册里也建议使用这种方式,标题都写的这么阔气:Powerful Navigation with XPath。
方法是使用Document的selectNodes(String XPath)方法,代码写法:
List l = doc.selectNodes("//COLS/COL1");
List<Node> allNodeList = doc.selectNodes("//*");
执行时却抛出以下异常:
Exception in thread "main" java.lang.NoClassDefFoundError: org/jaxen/JaxenException
at org.dom4j.DocumentFactory.createXPath(DocumentFactory.java:230)
at org.dom4j.tree.AbstractNode.createXPath(AbstractNode.java:207)
at org.dom4j.tree.AbstractNode.selectNodes(AbstractNode.java:164)
这么好用的方法怎么能抛异常呢,一路跟踪过去看,竟然是“List l = doc.selectNodes("//COLS/COL1");”这句报错,查了一下才知道,不光要有dom4j这个包,还要有jaxen 包:<jaxen-1.1-beta-6.jar>-238 KB,这应该是dom4j的基础包,在dom4j的zip包的lib目录里可以找到。即使用这个方法需要以下两个包:
dom4j-1.6.1.jar-306 KB
jaxen-1.1-beta-6.jar-238 KB
三、解释时selectNodes()语法特性
XPath 是 XML 的内容,这里 SelectNodes 是 C# 中 XmlDocument 或 XmlNode 的一个方法。SelectNodes 使用 XPath 来选取节点。
重要语法
SelectNodes("item")
从当前节点的儿子节点中选择名称为 item 的节点。
SelectNodes("/item")
从根节点的儿子节点中选择名称为 item 的节点。
SelectNodes("//item")
从任意位置的节点上选择名称为 item 的节点。要重点突出这个任意位置,它不受当前节点的影响,也就是说假如当前节点是在第 100 层(有点夸张),也可以选择第一层的名称为 item 的节点。
SelectNodes(".")
选择当前节点。
SelectNodes("..")
选择当前节点的父节点。
SelectNodes("//item[@name]")
在 SelectNodes("//item") 的基础上,增加了一个限制,就是要求拥有 name 属性。
SelectNodes("//item[@name='111']")
在 SelectNodes("//item[@name]") 的基础上,增加了一个限制,就是要求 name 属性值为 111。注意语法中有引号;如果没有引号,则表示是数字类型,对于数字类型可以使用大于号、小于号等,比如:SelectNodes("//item[@v>333]")。
SelectNodes("//item[1]")
选择第一个 item,注意是第一个,不是第二个。
还有这里是指亲兄弟间的第一个 item,也就是说:父级若有三个 item,则选择第一个;若父级第二个 item 的有两个名称同样为 item 的儿子,则第一个儿子会被选择出来;若父级第三个 item 的也有两个名称同样为 item 的儿子,则第一个儿子也会被选择出来……
SelectNodes("//item[last()-1]")
倒数第二个节点,同样是指亲兄弟间的倒数第二个。
SelectNodes("//item[position()<=2]")
位置为第一和第二的节点(第一个节点的 position() 为 1),同样是指亲兄弟间的位置。
SelectNodes("//@name")
SelectNodes("/root/item/@name") 取 item 的 name 属性
选择 name 属性,注意这下选择的是属性,而不是节点了。用 Value 属性获取属性集合的属性值。
SelectNodes("/root/item")
根节点 root 下的 item 儿子节点。
SelectNodes("/root//item")
根节点 root 下的不管是儿子、孙子、重孙子……,只要是名称为 item 的统统选取出来。
通配符
- 可用 * 表示任意节点名称,比如 SelectNodes("/channel/*/item");
- 用 @* 表示任意属性;
- 用 node() 表示任意类型的节点;
- 用 text() 表示文本类型的节点,实际上也就是表示取文本节点(元素节点下面是文本节点,文本节点下面才是文字)。
运算符
| 表示或。SelectNodes("//item|//channel"),选择 item 或 channel 节点。