scrapy爬虫始终定位不到元素

在尝试使用Scrapy爬虫抓取网页时,发现通过XPath无法定位到目标元素。经过检查,确认XPath路径正确,但在源代码中未找到该元素,怀疑是由于网页的异步加载导致。通过分析网络请求,未能直接找到所需元素。最终改用Firefox和Selenium,通过获取XPath的绝对路径成功定位并抓取了元素,反映出基础能力还需加强。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

scrapy爬虫始终定位不到元素

欲抓取网页链接
谷歌浏览器审查时界面
在这里插入图片描述
复制的xpath路径为//*[@id=“history”]/tr[1]/td[1],使用浏览器控制台验证无误
在这里插入图片描述
但使用get和xpath得到值为空列表
这里使用requests库定位抓取元素

查看网页源代码对应路径下确实无此元素在这里插入图片描述疑为异步加载网页,查看network
在这里插入图片描述
搜索并未找到欲抓取元素,难受。
不断调试试验,最终在firefox复制xpath绝对路径,并使用selenium成功定位到元素,成功代码如下:


                
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值