xpath小技巧

1、选择当前节点下部分节点

如:

获取http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2018/11/01/01/110101001.html的“统计用区划代码”和“城乡分类代码”两列内容

xpath = '//tr[@class="villagetr"]/td/preceding-sibling::*[1]/text()'

获取http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2018/11/01/01/110101001.html的“城乡分类代码”和“名称”两列内容

xpath = '//tr[@class="villagetr"]/td/following-sibling::*[1]/text()'

参考网址:

https://www.jianshu.com/p/820dcd013993

https://blog.youkuaiyun.com/lengchun10/article/details/41044119

http://www.itkeyword.com/doc/3425694516199323x896/using-xpath-selector-following-siblingtext-in-selenium-python

2、选取当前节点不包含值为**的节点

如:

获取http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2018/11/01/01/110101001.html的三列内容中不为“111”的内容

xpath = '//tr[@class="villagetr"]/td[text()!="111"]/text()'

3、选取当前节点包含值为**的节点

如:

①获取http://www.xzqh.org/old/waiguo/asia/index.htm的所有国家列表

xpath = '//div[@align="center"]//div[@align="center"]//tr/td/a[contains(@target,"_blank")]/text()'

②获取https://www.fmprc.gov.cn/web/gjhdq_676201/gj_676203/dyz_681240/1206_681890/1206x0_681892/包含“行政区划”的节点的节点文本

xpath = '//div[@class="wjbox_content"]/p[contains(text(),"行政区划")]/text()'

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值