XPath的使用

本文详细介绍了XPath的基本概念,包括NodeSet和Node的概念,并通过Java代码实例展示了如何使用XPath进行节点选择、获取、操作等常见操作。

   前面介绍了Jsoup,现在记录一下XPath

   XPath主要是NodeSet和Node,NodeSet是节点的集合,Node是一个节点。其他的是一样的操作。

  

    XPath的操作:

 

    

package SWPU;

import java.io.File;
import java.io.FileInputStream;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.xpath.XPath;
import javax.xml.xpath.XPathConstants;
import javax.xml.xpath.XPathExpressionException;
import javax.xml.xpath.XPathFactory;
 
import org.w3c.dom.Document;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
 
public class XPathDemo {
    private static Document doc;
    private static XPath xpath;
 
    public static void main(String[] args) throws Exception {
        init();
        getRootEle();
        getChildEles();
        getPartEles();
        haveChildsEles();
        getLevelEles();
        getAttrEles();
         
        //打印根节点下的所有元素节点
        System.out.println(doc.getDocumentElement().getChildNodes().getLength());
        NodeList nodeList = doc.getDocumentElement().getChildNodes();
        for (int i = 0; i < nodeList.getLength(); i++) {
            if (nodeList.item(i).getNodeType() == Node.ELEMENT_NODE) {
                System.out.print(nodeList.item(i).getNodeName() + " ");
            }
        }
    }
 
    // 初始化Document、XPath对象
    public static void init() throws Exception {
        // 创建Document对象
        DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
        dbf.setValidating(false);
        DocumentBuilder db = dbf.newDocumentBuilder();
        doc = db.parse(new FileInputStream(new File("F://demo.xml")));
 
        // 创建XPath对象
        XPathFactory factory = XPathFactory.newInstance();
        xpath = factory.newXPath();
    }
 
    // 获取根元素
    // 表达式可以更换为/*,/rss
    public static void getRootEle() throws XPathExpressionException {
        Node node = (Node) xpath.evaluate("/rss", doc, XPathConstants.NODE);  //提取出相应的路径中的内容,NODE是指一个
        System.out.println(node.getNodeName() + "--------"  //getNodeName()获取节点名称
                + node.getNodeValue()); //getNodeValue()获取节点的值
    }
 
    // 获取子元素并打印
    public static void getChildEles() throws XPathExpressionException {
        NodeList nodeList = (NodeList) xpath.evaluate("/rss/channel/*", doc,  //获取的是整个元素
                XPathConstants.NODESET);     //返回的是节点列表 ,NODESET是节点列表
        for (int i = 0; i < nodeList.getLength(); i++) {
            System.out.print(nodeList.item(i).getNodeName() + ":"+nodeList.item(i).getTextContent()+"\n");//通过item()来获得每一个列表项  
        }
        System.out.println();
    }
 
    // 获取部分元素
    // 只获取元素名称为title的元素
    public static void getPartEles() throws XPathExpressionException {
        NodeList nodeList = (NodeList) xpath.evaluate("//*[name() = 'title']",
                doc, XPathConstants.NODESET);
        for (int i = 0; i < nodeList.getLength(); i++) {
            System.out.print(nodeList.item(i).getNodeName() + "-->" 
                    + nodeList.item(i).getTextContent());
        }
        System.out.println();
    }
 
    // 获取包含子节点的元素
    public static void haveChildsEles() throws XPathExpressionException {
        NodeList nodeList = (NodeList) xpath.evaluate("//*[*]", doc,
                XPathConstants.NODESET);
        for (int i = 0; i < nodeList.getLength(); i++) {
            System.out.print(nodeList.item(i).getNodeName() + " ");
        }
        System.out.println();
    }
 
    // 获取指定层级的元素
    public static void getLevelEles() throws XPathExpressionException {
        NodeList nodeList = (NodeList) xpath.evaluate("/*/*/*/*", doc,  //四层路径下面匹配
                XPathConstants.NODESET);
        System.out.println("LEVEL:\n");
        for (int i = 0; i < nodeList.getLength(); i++) {
            System.out.print(nodeList.item(i).getNodeName() + "-->"
                    + nodeList.item(i).getTextContent() + "\n ");
        }
        System.out.println("-----------------------------");
    }
 
    // 获取指定属性的元素
    // 获取所有大于指定价格的书箱
    public static void getAttrEles() throws XPathExpressionException {
        NodeList nodeList = (NodeList) xpath.evaluate("//bookstore/book[price>35.00]/title", doc,
                XPathConstants.NODESET);                        //上面找的是title元素,price〉35.00作为查询条件
        System.out.println("Attibute:\n");
        for (int i = 0; i < nodeList.getLength(); i++) {
            System.out.print(nodeList.item(i).getNodeName() + "-->"
                    + nodeList.item(i).getTextContent() + " ");
        }
        System.out.println();
    }
}


 

 

### 三级标题:XPath 在 Selenium 中的应用 在自动化测试过程中,XPath 是一种非常强大的元素定位方式。通过 XPath 表达式,可以精确地找到页面中的任意 HTML 元素,即使该元素没有明确的 ID 或 class 属性。 Selenium 支持使用 XPath 进行元素定位,并提供了 `find_element(By.XPATH, "xpath=表达式")` 和 `find_elements(By.XPATH, "xpath=表达式")` 方法来查找单个或多个匹配的元素 [^3]。例如: ```python element = driver.find_element(By.XPATH, "/html/body/div/form/input") ``` 此代码表示通过绝对路径 `/html/body/div/form/input` 定位一个输入框元素。 #### 使用相对路径 XPath 支持相对路径写法,这在复杂的页面结构中更为灵活。例如: ```python element = driver.find_element(By.XPATH, "//div[@id='login-form']//input[@name='username']") ``` 此表达式表示查找任意层级下的 `div` 元素,其 `id` 为 `login-form`,然后在其子元素中查找 `name` 为 `username` 的 `input` 元素 [^3]。 #### 使用属性定位 XPath 可以根据元素的属性值进行定位。例如,以下代码查找 `type` 为 `submit` 的按钮: ```python element = driver.find_element(By.XPATH, "//button[@type='submit']") ``` 还可以通过部分匹配属性值,例如: - `contains()` 函数用于模糊匹配: ```python element = driver.find_element(By.XPATH, "//a[contains(text(), 'Login')]") ``` 此表达式查找文本内容包含“Login”的链接。 - `starts-with()` 函数用于匹配以特定字符串开头的属性值: ```python element = driver.find_element(By.XPATH, "//input[starts-with(@id, 'user')]") ``` #### 处理动态生成的内容 对于动态加载的网页内容,XPath 可以结合条件判断进行定位。例如: ```python element = driver.find_element(By.XPATH, "//ul/li[last()]") ``` 此表达式表示选择最后一个 `<li>` 子元素。 #### 轴(Axis)和节点关系 XPath 提供了轴(Axis)功能,用于定义节点之间的关系。常见的轴包括: - `parent::`:选择当前节点的父节点。 - `child::`:选择当前节点的直接子节点。 - `ancestor::`:选择所有祖先节点。 - `descendant::`:选择所有后代节点。 例如,以下代码表示查找当前节点的父节点并进一步定位其兄弟节点: ```python element = driver.find_element(By.XPATH, "//input[@id='email']/parent::div/following-sibling::div/button") ``` #### 调试与验证 为了确保 XPath 表达式的正确性,可以通过浏览器开发者工具进行调试。打开控制台并在 Console 面板中输入 `$x("xpath=表达式")` 来查看匹配结果。 此外,在实际测试脚本中,建议优先使用 `find_elements` 获取多个匹配项,并手动筛选出目标元素以确保唯一性。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值