XPath(XML Path Language)是一种用于在XML文档中进行选择节点的查询语言,也常用于HTML文档的解析。它最初是为XML设计的,但由于HTML和XML在结构上有许多相似之处,因此也被广泛用于HTML文档的解析。
路径:既然是查询节点,那就免不了要用到路径,也就是查询节点的路径,路径分为相对路径和绝对路径。
xPath中绝对路径使用 / 开头,并且使用绝对路径定位元素,必须从/html开始,如:/html/body/div[1]/a/img。绝对路径较长,其中可能会包含变化的部分,所以不见单独使用绝对路径去定位元素路径。
xPath中相对路径使用 // 开头,比如 //*[@class]
,表示只要包含class属性的元素均可匹配,无论从哪个节点开始。
下面给出常见的节点选择实例:
表达式 | 说明 | 举例 |
---|---|---|
/ | 从根节点开始 | /html/body/div |
// | 从任意节点开始 | //p |
. | 选取当前节点 | //div/. |
... | 当前节点的父节点 | //div/... |
@ | 选取包含某属性的元素 | //div[@class](选取包含class属性的div) |
* | 表示任意元素或者任意属性 | //*[@class] |
通过以下方式可以获取元素的绝对路径或相对路径。
这一篇就到这里,帮助大家初步认识xpath语言。
下一篇文章根据具体的例子,通过元素、属性名、属性值以及三者结合等方式进行元素定位。
祝愉快~