基于XPath1.0标准,通过以下22个实例介绍XPath的特性。基本的XPath语法类似于在一个文件系统中定位文件(下面实例中红色文字表示选择结果)
1、如果路径以斜线 / 开始, 那么该路径就表示到一个元素的绝对路径
(1)."/AAA"表示选择根元素AAA:
<AAA>
<BBB/>
<CCC/>
<BBB/>
<BBB/>
<DDD>
<BBB/>
</DDD>
<CCC/>
</AAA>
(2)."/AAA/DDD/BBB"表示选择AAA的子元素DDD的所有子元素:
<AAA>
<BBB/>
<CCC/>
<BBB/>
<BBB/>
<DDD>
<BBB/>
</DDD>
<CCC/>
</AAA>
2、如果路径以双斜线 // 开头, 则表示选择文档中所有满足双斜线//之后规则的元素(无论层级关系)
(1)."//BBB"表示选择所有BBB元素:
<AAA>
<BBB/>
<CCC/>
<BBB/>
<DDD>
<BBB/>
</DDD>
<CCC>
<DDD>
<BBB/>
<BBB/>
</DDD>
</CCC>
</AAA>
(2)."//DDD/BBB"表示选择所有父元素是DDD的BBB元素:
<AAA>
<BBB/>
<CCC/>
<BBB/>
<DDD>
<BBB/>
</DDD>
<CCC>
<DDD>
<BBB/>
<BBB/>
</DDD>
</CCC>
</AAA>
3、星号 * 表示选择所有由星号之前的路径所定位的元素
(1)."/AAA/CCC/DDD/*"表示选择所有路径依附于/AAA/CCC/DDD的元素:
<AAA>
<XXX>
<DDD>
<BBB/>
<BBB/>
<EEE/>
<FFF/>
</DDD>
</XXX>
<CCC>
<DDD>
<BBB/>
<BBB/>
<EEE/>
<FFF/>
</DDD>
</CCC>
<CCC>
<BBB>
<BBB>
<BBB/>
</BBB>
</BBB>
</CCC>
</AAA>
(2). “/*/*/*/BBB”表示选择所有的有3个祖先元素的BBB元素:
<AAA>
<XXX>
<DDD>
<BBB/>
<BBB/>
<EEE/>
<FFF/>
</DDD>
</XXX>
<CCC>
<DDD>
<BBB/>
<BBB/>
<EEE/>
<FFF/>
</DDD>
</CCC>
<CCC>
<BBB>
<BBB>
<BBB/>
</BBB>
</BBB>
</CCC>
</AAA>
4、方块号里的表达式可以进一步的指定元素, 其中数字表示元素在选择集里的位置, 而last()函数则表示选择集中的最后一个元素
(1)."/AAA/BBB[1]"表示选择AAA的第一个BBB子元素:
<AAA>
<BBB/>
<BBB/>
<BBB/>
<BBB/>
</AAA>
(2).“/AAA/BBB[last()]‘表示选择AAA的最后一个BBB子元素:
<AAA>
<BBB/>
<BBB/>
<BBB/>
<BBB/>
</AAA>
5、属性通过前缀 @ 来指定
(1)."//@id"表示选择所有的id属性:
<AAA>
<BBB id = "b1"/>
<BBB id =
"b2"/>
<BBB name = "bbb"/>
<BBB/>
</AAA>
(2)."//BBB[@id]"表示选择有id属性的BBB元素:
<AAA>
<BBB id = "b1"/>
<BBB id =
"b2"/>
<BBB name = "bbb"/>
<BBB/>
</AAA>
(3)."//BBB[@*]"表示选择有任意属性的BBB元素:
<AAA>
<BBB id = "b1"/>
<BBB id =
"b2"/>
<BBB name = "bbb"/>
<BBB/>
</AAA>
(4)."//BBB[not(@*)]"表示选择没有属性的BBB元素:
<AAA>
<BBB id = "b1"/>
<BBB id =
"b2"/>
<BBB name = "bbb"/>
<BBB/>
</AAA>
6、属性的值可以被用来作为选择的准则, normalize-space函数删除了前部和尾部的空格, 并且把连续的空格串替换为一个单一的空格
(1)."//BBB[@name='bbb']"表示选择含有属性name且其值为'bbb'的BBB元素:
<AAA>
<BBB id = "b1"/>
<BBB name = "
bbb "/>
<BBB name = "bbb"/>
</AAA>
(2)."//BBB[normalize-space(@name)='bbb']"表示选择含有属性name且其值(在用normalize-space函数去掉前后空格后)为'bbb'的BBB元素:
<AAA>
<BBB id = "b1"/>
<BBB name = "
bbb "/>
<BBB name = "bbb"/>
</AAA>
7、count()函数可以计数所选元素的个数
(1)."//*[count(BBB)=2]"表示选择含有2个BBB子元素的元素:
<AAA>
<CCC>
<BBB/>
<BBB/>
<BBB/>
</CCC>
<DDD>
<BBB/>
<BBB/>
</DDD>
<EEE>
<CCC/>
<DDD/>
</EEE>
</AAA>
(2).”//*[count(*)=2]“表示选择含有2个子元素的元素:
<AAA>
<CCC>
<BBB/>
<BBB/>
<BBB/>
</CCC>
<DDD>
<BBB/>
<BBB/>
</DDD>
<EEE>
<CCC/>
<DDD/>
</EEE>
</AAA>
8、name()函数返回元素的名称, start-with()函数在该函数的第一个参数字符串是以第二个参数字符开始的情况返回true, contains()函数当其第一个字符串参数包含有第二个字符串参数时返回true
(1).”//*[name()='BBB']“表示选择所有名称为BBB的元素(这里等价于//BBB):
<AAA>
<BCC>
<BBB/>
<BBB/>
<BBB/>
</BCC>
<DDB>
<BBB/>
<BBB/>
</DDB>
<BEC>
<CCC/>
<DBD/>
</BEC>
</AAA>
(2)."//*[starts-with(name(),'B')]"表示选择所有名称以"B"起始的元素:
<AAA>
<BCC>
<BBB/>
<BBB/>
<BBB/>
</BCC>
<DDB>
<BBB/>
<BBB/>
</DDB>
<BEC>
<CCC/>
<DBD/>
</BEC>
</AAA>
(3)."//*[contains(name(),'C')]"表示选择所有名称包含"C"的元素:
<AAA>
<BCC>
<BBB/>
<BBB/>
<BBB/>
</BCC>
<DDB>
<BBB/>
<BBB/>
</DDB>
<BEC>
<CCC/>
<DBD/>
</BEC>
</AAA>
9、string-length函数返回字符串的字符数,你应该用<替代<, 用>代替>
(1).”//*[string-length(name()) = 3]”表示选择名字长度为3的元素:
<AAA>
<Q/>
<SSSS/>
<BB/>
<CCC/>
<DDDDDDDD/>
<EEEE/>
</AAA>
(2)."//*[string-length(name()) < 3]"表示//*[string-length(name()) < 3](大于号同样适用):
<AAA>
<Q/>
<SSSS/>
<BB/>
<CCC/>
<DDDDDDDD/>
<EEEE/>
</AAA>
10、多个路径可以用分隔符 | 合并在一起
(1)."//CCC | //BBB"表示选择所有的CCC和BBB元素:
<AAA>
<BBB/>
<CCC/>
<DDD>
<CCC/>
</DDD>
<EEE/>
</AAA>
(2)."/AAA/EEE | //BBB"表示选择所有的BBB元素和所有子元素是AAA的EEE元素:
<AAA>
<BBB/>
<CCC/>
<DDD>
<CCC/>
</DDD>
<EEE/>
</AAA>
(3)."/AAA/EEE | //DDD/CCC | /AAA | //BBB"表示可以合并的路径数目没有限制:
<AAA>
<BBB/>
<CCC/>
<DDD>
<CCC/>
</DDD>
<EEE/>
</AAA>
11、child轴(axis)包含上下文节点的子元素, 作为默认的轴,可以忽略不写
(1)."/child::AAA"等价于/AAA:
<AAA>
<BBB/>
<CCC/>
</AAA>
(2)."/child::AAA/child::BBB"等价于/AAA/BBB:
<AAA>
<BBB/>
<CCC/>
</AAA>
(3)."/child::AAA/BBB":
<AAA>
<BBB/>
<CCC/>
</AAA>