XPath教程——实例介绍<一>

本文通过22个实例介绍了XPath1.0标准下选择XML文档中元素的方法。包括使用绝对路径、通配符、属性选择及函数等技巧。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

基于XPath1.0标准,通过以下22个实例介绍XPath的特性。基本的XPath语法类似于在一个文件系统中定位文件(下面实例中红色文字表示选择结果)

1、如果路径以斜线 / 开始, 那么该路径就表示到一个元素的绝对路径

(1)."/AAA"表示选择根元素AAA:

    <AAA>
          <BBB/>
          <CCC/>
          <BBB/>
          <BBB/>
          <DDD>
               <BBB/>
          </DDD>
          <CCC/>
     </AAA>

(2)."/AAA/DDD/BBB"表示选择AAA的子元素DDD的所有子元素:

    <AAA>
          <BBB/>
          <CCC/>
          <BBB/>
          <BBB/>
          <DDD>
               <BBB/>
          </DDD>
          <CCC/>
     </AAA>

2、如果路径以双斜线 // 开头, 则表示选择文档中所有满足双斜线//之后规则的元素(无论层级关系)

(1)."//BBB"表示选择所有BBB元素:

    <AAA>
          <BBB/>
          <CCC/>
          <BBB/>
          <DDD>
               <BBB/>
          </DDD>
          <CCC>
               <DDD>
                    <BBB/>
                    <
BBB/>
               </DDD>
          </CCC>
     </AAA>

 (2)."//DDD/BBB"表示选择所有父元素是DDD的BBB元素:

    <AAA

          <BBB/>
          <CCC/>
          <BBB/>
          <DDD>
               <BBB/>
          </DDD>
          <CCC>
               <DDD>
                    <BBB/>
                    <
BBB/>
               </DDD>
          </CCC>
     </AAA>

3、星号 * 表示选择所有由星号之前的路径所定位的元素

(1)."/AAA/CCC/DDD/*"表示选择所有路径依附于/AAA/CCC/DDD的元素:

    <AAA>
          <XXX>
               <DDD>
                    <BBB/>
                    <BBB/>
                    <EEE/>
                    <FFF/>
               </DDD>
          </XXX>
          <CCC>
               <DDD>
                    <BBB/>
                    <
BBB/>
                    <
EEE/>
                    <
FFF/>
               </DDD>
          </CCC>
          <CCC>
               <BBB>
                    <BBB>
                         <BBB/>
                    </BBB>
               </BBB>
          </CCC>
     </AAA>

(2). “/*/*/*/BBB”表示选择所有的有3个祖先元素的BBB元素:

   <AAA>
          <XXX>
               <DDD>
                    <BBB/>
                    <
BBB/>
                    <EEE/>
                    <FFF/>
               </DDD>
          </XXX>
          <CCC>
               <DDD>
                    <BBB/>
                    <
BBB/>
                    <EEE/>
                    <FFF/>
               </DDD>
          </CCC>
          <CCC>
               <BBB>
                    <BBB>
                         <BBB/>
                    </BBB>
               </BBB>
          </CCC>
     </AAA>

4、方块号里的表达式可以进一步的指定元素, 其中数字表示元素在选择集里的位置, 而last()函数则表示选择集中的最后一个元素

(1)."/AAA/BBB[1]"表示选择AAA的第一个BBB子元素:

    <AAA>
          <BBB/>
          <BBB/>
          <BBB/>
          <BBB/>
     </AAA>

(2).“/AAA/BBB[last()]‘表示选择AAA的最后一个BBB子元素:

     <AAA>
          <BBB/>
          <BBB/>
          <BBB/>
          <BBB/>
     </AAA>

5、属性通过前缀 @ 来指定

(1)."//@id"表示选择所有的id属性:

<AAA>
          <BBB id = "b1"/>
          <BBB id = "b2"/>
          <BBB name = "bbb"/>
          <BBB/>
     </AAA>

(2)."//BBB[@id]"表示选择有id属性的BBB元素:

<AAA>
          <BBB id = "b1"/>
          <BBB id = "b2"/>
          <BBB name = "bbb"/>
          <BBB/>
     </AAA>

(3)."//BBB[@*]"表示选择有任意属性的BBB元素:

     <AAA>
          <BBB id = "b1"/>
          <BBB id = "b2"/>
          <BBB name = "bbb"/>
          <BBB/>
     </AAA>

(4)."//BBB[not(@*)]"表示选择没有属性的BBB元素:

    <AAA>
          <BBB id = "b1"/>
          <BBB id = "b2"/>
          <BBB name = "bbb"/>
          <BBB/>
     </AAA>

6、属性的值可以被用来作为选择的准则, normalize-space函数删除了前部和尾部的空格, 并且把连续的空格串替换为一个单一的空格

(1)."//BBB[@name='bbb']"表示选择含有属性name且其值为'bbb'的BBB元素:

    <AAA>
          <BBB id = "b1"/>
          <BBB name = " bbb "/>
          <BBB name = "bbb"/>
     </AAA>

(2)."//BBB[normalize-space(@name)='bbb']"表示选择含有属性name且其值(在用normalize-space函数去掉前后空格后)为'bbb'的BBB元素:

     <AAA>
          <BBB id = "b1"/>
          <BBB name = " bbb "/>
          <BBB name = "bbb"/>
     </AAA>

7、count()函数可以计数所选元素的个数

(1)."//*[count(BBB)=2]"表示选择含有2个BBB子元素的元素:

     <AAA>
          <CCC>
               <BBB/>
               <BBB/>
               <BBB/>
          </CCC>
          <DDD>
               <BBB/>
               <BBB/>
          </DDD>
          <EEE>
               <CCC/>
               <DDD/>
          </EEE>
     </AAA>

(2).”//*[count(*)=2]“表示选择含有2个子元素的元素:

     <AAA>
          <CCC>
               <BBB/>
               <BBB/>
               <BBB/>
          </CCC>
          <DDD>
               <BBB/>
               <BBB/>
          </DDD>
          <EEE>
               <CCC/>
               <DDD/>
          </EEE>
     </AAA>

8、name()函数返回元素的名称, start-with()函数在该函数的第一个参数字符串是以第二个参数字符开始的情况返回true, contains()函数当其第一个字符串参数包含有第二个字符串参数时返回true

(1).”//*[name()='BBB']“表示选择所有名称为BBB的元素(这里等价于//BBB):

     <AAA>
          <BCC>
               <BBB/>
               <
BBB/>
               <
BBB/>
          </BCC>
          <DDB>
               <BBB/>
               <
BBB/>
          </DDB>
          <BEC>
               <CCC/>
               <DBD/>
          </BEC>
     </AAA>

(2)."//*[starts-with(name(),'B')]"表示选择所有名称以"B"起始的元素:

     <AAA>
          <BCC>
               <
BBB/>
               <
BBB/>
               <
BBB/>
          </
BCC>
          <DDB>
               <BBB/>
               <
BBB/>
          </DDB>
          <BEC>
               <CCC/>
               <DBD/>
          </BEC>
     </AAA>

(3)."//*[contains(name(),'C')]"表示选择所有名称包含"C"的元素:

     <AAA>
          <BCC>
               <BBB/>
               <BBB/>
               <BBB/>
          </BCC>
          <DDB>
               <BBB/>
               <BBB/>
          </DDB>
          <BEC>
               <CCC/>
               <DBD/>
          </BEC>
     </AAA>

9、string-length函数返回字符串的字符数,你应该用&lt;替代<, 用&gt;代替>

(1).”//*[string-length(name()) = 3]”表示选择名字长度为3的元素:

     <AAA>
          <Q/>
          <SSSS/>
          <BB/>
          <CCC/>
          <DDDDDDDD/>
          <EEEE/>
     </AAA>

(2)."//*[string-length(name()) < 3]"表示//*[string-length(name()) < 3](大于号同样适用):

     <AAA>
          <Q/>
          <SSSS/>
          <BB/>
          <CCC/>
          <DDDDDDDD/>
          <EEEE/>
     </AAA>

10、多个路径可以用分隔符 | 合并在一起

(1)."//CCC | //BBB"表示选择所有的CCC和BBB元素:

     <AAA>
          <BBB/>
          <
CCC/>
          <DDD>
               <CCC/>
          </DDD>
          <EEE/>
     </AAA>

(2)."/AAA/EEE | //BBB"表示选择所有的BBB元素和所有子元素是AAA的EEE元素:

     <AAA>
          <BBB/>
          <CCC/>
          <DDD>
               <CCC/>
          </DDD>
          <EEE/>
     </AAA>

(3)."/AAA/EEE | //DDD/CCC | /AAA | //BBB"表示可以合并的路径数目没有限制:

     <AAA>
          <
BBB/>
          <CCC/>
          <DDD>
               <CCC/>
          </DDD>
          <EEE/>
     </
AAA>

11、child轴(axis)包含上下文节点的子元素, 作为默认的轴,可以忽略不写

(1)."/child::AAA"等价于/AAA:

     <AAA>
          <BBB/>
          <CCC/>
     </AAA>

(2)."/child::AAA/child::BBB"等价于/AAA/BBB:

     <AAA>
          <BBB/>
          <CCC/>
     </AAA>

(3)."/child::AAA/BBB":

     <AAA>
          <BBB/>
          <CCC/>
     </AAA>

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值