Xpath解析XML文件

最新推荐文章于 2022-08-18 11:53:03 发布

weixin_34315665

最新推荐文章于 2022-08-18 11:53:03 发布

阅读量121

点赞数

CC 4.0 BY-SA版权

文章标签： python java

原文链接：https://my.oschina.net/marjeylee/blog/787735

2019独角兽企业重金招聘Python工程师标准>>>

Xpath 是一种比较好用的xml文档解析工具。相比较于DOM和SAX，Xpath主要用于在解析之前已经知道要解析的的节点名称和属性（貌似其他两种也是呀）。

1.节点类型

XPath中有七种结点类型：元素、属性、文本、命名空间、处理指令、注释以及文档节点（或称为根节点）。文档中存在元素节点，属性节点，根节点

2.常用路径表达式

表达式	描述
节点名称(nodename)	选取此节点的所有子节点
/	从根节点选取
//	从匹配选择的当前节点选择文档中的节点，而不考虑它们的位置
.	选取当前节点
..	选取当前节点的父节点
@	选取属性

示例如下：

//@lang

选取所有名为 lang 的属性

3.限定语

用来查找某个特定的节点或者包含某个指定的值的节点。以方括号括起

//book[price>35.00]	选择所有book 元素，且其中的 price 元素的值须大于 35.00
/bookstore/book[1]	选取属于 bookstore 子元素的第一个 book 元素。
/bookstore/book[last()]	选取属于 bookstore 子元素的最后一个 book 元素。
/bookstore/book[last()-1]	选取属于 bookstore 子元素的倒数第二个 book 元素。
/bookstore/book[position()<3]	选取最前面的两个属于 bookstore 元素的子元素的 book 元素。
//title[@lang]	选取所有拥有名为 lang 的属性的 title 元素。
//title[@lang='eng']	选取所有 title 元素，且这些元素拥有值为 eng 的 lang 属性。
/bookstore/book[price>35.00]	选取所有 bookstore 元素的 book 元素，且其中的 price 元素的值须大于 35.00。
/bookstore/book[price>35.00]/title	选取所有 bookstore 元素中的 book 元素的 title 元素，且其中的 price 元素的值须大于 35.00。

4 .通配符

通配符	描述
*	匹配任何元素节点
@*	匹配任何属性节点
node()	匹配任何类型的节点
\|	选取若干路径
使用示例
路径表达式	结果
/bookstore/*	选取 bookstore 元素的所有子节点
//*	选取文档中的所有元素
//title[@*]	选取所有带有属性的 title 元素。
//book/title \| //book/price	选取所有 book 元素的 tilte 和 price 元素。
//title \| //price	选取所有文档中的 title 和 price 元素。
/bookstore/book/title \| //price	选取所有属于 bookstore 元素的 book 元素的 title 元素，以及文档中所有的 price 元素

有个问题。

XPathConstants

这个类的具体作用是什么？

不管了，等用到再说吧。

package per.XMLFileParse;

import org.w3c.dom.Document;
import org.w3c.dom.NamedNodeMap;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.xpath.XPath;
import javax.xml.xpath.XPathConstants;
import javax.xml.xpath.XPathExpressionException;
import javax.xml.xpath.XPathFactory;
import java.io.File;

/**
 * Created by li on 2016/11/14.
 * 解析xml文件的工具类。
 */
public class XMLParser {
    private String path;

    /**
     * 构造器，要解析xml文档，首先必须先指导xml文档在哪吧。
     */
    public XMLParser(String path) {
        this.path = path;
    }

    /**
     * 传入一个xml文件的路径，获取Document对象
     * param path; xml 文件路径。
     * return document xml 的树节点对象。
     **/
    static Document getDocument(String path) {
        Document document = null;
        try {
            DocumentBuilderFactory documentBuilderFactory = DocumentBuilderFactory.newInstance();
            documentBuilderFactory.setValidating(false);
            DocumentBuilder documentBuilder = documentBuilderFactory.newDocumentBuilder();
            document = documentBuilder.parse(new File(path));
        } catch (Exception e) {
            System.out.println("获取xml文档节点失败。");
        }
        return document;
    }

    /**
     * 创建一个用于解析文档的xpath对象的方法。
     * param ;null
     * return XPath对象
     */
    static XPath getXPath() {
        XPathFactory xPathFactory = XPathFactory.newInstance();
        return xPathFactory.newXPath();
    }


    public static void main(String[] args) {
        Node node = getSpecifyNode("G:\\completeTheAim\\god\\MyProject\\src\\main\\java\\per\\myproject\\interaction\\set_hi_wtgl_fjxx.xml", "/service/inpoutData/vo");
        System.out.println(node.hasChildNodes());
        NamedNodeMap namedNodeMap = node.getAttributes();
        System.out.println(namedNodeMap.item(1).getNodeValue());
        System.out.println(namedNodeMap.getLength());
    }

    /**
     * 工具方法，用于xml文档的获取根元素。
     */
    static Node getRootNode(String path) {
        Document document = getDocument(path);
        XPath xPath = getXPath();
        Node node = null;
        try {
            node = (Node) xPath.evaluate("/*", document, XPathConstants.NODE);
        } catch (XPathExpressionException e) {
            System.out.println("获取xml文档根节点失败。");
        }
        return node;
    }

    /**
     * 输入xml文件的path和文档中指定路径，获得那个节点。
     * param:filePath xml文件路径
     * param:nodePath 节点路径
     * return:node 指定path的node
     */
    static Node getSpecifyNode(String filePath, String nodePath) {
        Document document = getDocument(filePath);
        XPath xPath = getXPath();
        Node node = null;
        try {
            node = (Node) xPath.evaluate(nodePath, document, XPathConstants.NODE);
        } catch (XPathExpressionException e) {
            System.out.println("获取xml文档根节点失败。");
        }
        return node;
    }
}

<?xml version="1.0" encoding="UTF-8"?>
<service  class="com.hi.problem.service.PM_GET_XMXX">
    <inpoutData>
        <vo type="HI_WTGL_XMXX" name="in" />
    </inpoutData>
    <outputData>
        <vo type="HI_WTGL_XMXX" name="out" />
    </outputData>
</service>

转载于:https://my.oschina.net/marjeylee/blog/787735