Python+Selenium爬虫:定位元素无ID和class等属性解决办法

本文介绍了一种在Selenium爬虫中定位无ID和class属性的网页元素的方法。通过XPath相对路径,从父节点开始定位,成功解决了无法直接通过ID定位的问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

今天笔者进行数据爬虫的时候遇到一个问题,所需要定位的input输入框元素和button按钮元素都没有ID和此class等属性。代码如下:

<div id="headerScaher" class="scaher hover">
    <input type="text" placeholder="IP、域名、文件HASH(MD5/SHA1/SHA256)、邮箱"> 
    <button></button>
</div>

之前笔者在用Selenium进行爬虫的时候,对ID和输入框的定位都是直接定位的,如下:

ip_put = wait.until(EC.presence_of_element_located((By.ID, 'ip')))
click_btn=wait.until(EC.presence_of_element_located((By.ID,'embed-captcha'))) 

解决办法是用XPATH,通过相对路径去获取,也就是先定位到其父节点或者更高节点的元素,然后再通过相对位置去定位所需元素:

ip_put = wait.until(EC.presence_of_element_located((By.XPATH, "//div[@id='headerScaher']/input")))

 

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值