XPath即为XML Path简称,它是一种用来确定XML文档中某部分位置的语言
一、路径定位
1.绝对路径定位:以 / 开始,从元素最外层到指定元素之间的路径
(不推荐使用这种)
/html/body/div[1]/div[1]/div[5]/div/div/form/span[1]/input
- 相对路径定位:以 // 开始,从第一个符合条件的元素开始
//span/input
二、利用元素属性定位
//input[@id='kw']
三、层级与属性结合定位
//span/input[@name="wd"]
四、属性与逻辑运算符(and、or)结合定位
//input[@class="s_ipt" and @name="wd"]
//input[@class="s_ipt" or @name="wd"]
五、模糊匹配
a.contains()–属性中包含xxx的元素
//*[contains(@属性名,"xxx")]
或
//*[contains(text(), "xxx")]
例如:
//span[contains(text(), "按图片搜索")]
//input[contains(@id,'w')]
b.starts-with–匹配以xx开头的属性值
//标签名[starts-with(@属性名,'xxx')]
例如
//input[starts-with(@id,'k')]
六、元素文本内容定位
//标签名[text()='文本内容']
//a[text()='新闻']