爬虫:使用xpath排除不想要的标签

本文分享了使用XPath进行精确数据筛选的经验,特别是在Scrapy爬虫中排除特定标签的方法,通过示例展示如何仅提取所需的数据行。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

但愿天下所有的程序员需求 都会写,入坑秒跳出,程序无bug

昨天用scrapy爬取了一个关于邮政编码的网站,这时候遇到了一个问题,用xpath排除不想要的标签

话不多说先上图
在这里插入图片描述

在网上查了很多资料,好像大部分都是说,让我们全部提取出来之后,然后再 切片,或其他把不想要的剔除,但是我就想一次性把自己想要的提取到而不做额外的处理,最后,终于找到 如果只想要2-10的tr不要1和11的tr,xpath应该这么 写

tr[position()>1][position()<11]

顺利解决问题,但愿这篇文章对哪怕一个人有帮助,那 这篇文章就有存在的意义~~ 如果有什么建议 可以评论在下方哦~

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值