获取元素
XPath 使用路径表达式来选取 XML 文档中的节点或者节点集。这些路径表达式和我们在常规的电脑文件系统中看到的表达式非常相似。
/bookstore/book[1]选取属于bookstore子元素的第一个book元素
/bookstore/book[last()]选取属于bookstore子元素的最后一个book元素
/bookstore/bookllast0-1] 选取属于bookstore子元素的倒数第二个book元素。
/bookstore/book[position()<3] 选取最前面的两个属于bookstore元素的子元素的book元素。
//title[@lang] 选取所有拥有名为lang的属性的title元素。
//title[@lang='eng’] 选取所有title元素,且这些元素拥有值为eng的lang属性。
/html/*选取html元素的所有子元素
//*
html/node()/meta/@*
//title[@*]
//title|//price 选取文档中的所有title和price元素。
css选择器语法
.class .intro 选择class="intro"的所有元素。
#id #hrstname 选择id="frstname"的所有元素。
* 选择所有元素。
element p 选择所有元素。
通过元素之前嵌套关系
div,p 选择所有<div>元素和所有<p>元素。
div p 选择<div>元素内部的所有<p>元素。
div>p 选择父元素为<div>元素的所有<p>元素。
通过属性
选择属性所有元素。
选择的所有元素。
meta[name^="r"] 选择其src属性值以"https"开头的每个<meta>元素。
选择其属性以结尾的所有元素。
选择其属性中包含子串的每个元素。
通过父子关系
选择属于其父元素的唯一子元素的每个元素。
选择属于其父元素的第二个子元素的每个元素
从最后一个子元素开始计数。