selenium 使用 element.get_attribute('innerHTML') 获取不到源码的问题

本文介绍了一种在页面上获取所有a标签源码的方法,通常使用element.get_attribute('innerHTML')无法直接获取单个a标签的完整源码,但通过element.get_attribute('outerHTML')可以轻松实现。

如题, 获取到页面上所有 a 标签循环遍历时, 发现通过

element.get_attribute('innerHTML')

无法获取到单独一个 a 标签的源码. 谷歌了下发现了解决方案如下, 使用:

element.get_attribute('outerHTML')

参考: https://stackoverflow.com/a/8575709/8920453

做个记录

`element.get_attribute` 是 Selenium 中用于获取元素特定属性值的方法。在 Selenium 自动化测试中,当需要获取网页元素的某个属性值时,就可以使用该方法。 ### 使用方法 在 PythonSelenium 库中,`element.get_attribute` 方法的基本语法如下: ```python attribute_value = element.get_attribute(attribute_name) ``` 其中,`element` 是通过 Selenium 定位到的网页元素,`attribute_name` 是想要获取的属性名称,`attribute_value` 是该属性对应的值。 ### 示例代码 以下结合引用[1]中的代码,展示 `element.get_attribute` 的使用: ```python from selenium import webdriver import unittest class Test_BasicInfo(unittest.TestCase): def test_getBasicInfo(self): url = 'http://www.baidu.com' self.driver = webdriver.Chrome() self.driver.get(url) newElement = self.driver.find_element_by_link_text('新闻') # 使用 get_attribute 方法获取元素的 href 属性 href_value = newElement.get_attribute('href') print('元素的 href 属性值:', href_value) # 打印查找到元素的基本信息 print('元素的标签名:', newElement.tag_name) print('元素的 size:', newElement.size) test1 = Test_BasicInfo() test1.test_getBasicInfo() ``` ### 适用场景 - **数据提取**:当需要从网页中提取特定元素的属性值时,例如提取图片的 `src` 属性、链接的 `href` 属性等。 - **元素状态判断**:通过获取元素的 `disabled`、`checked` 等属性,判断元素的状态。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值