Python自动化获取页面元素

本文介绍了使用Selenium进行网页自动化时常见的操作技巧,包括获取页面标题、URL、浏览器版本号等基本信息,以及如何获取元素尺寸、文本和属性值等高级用法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、获取页面title

#获取当前页面的标题显示的字段
title
from selenium import webdriver
import time  

browser = webdriver.Chrome()
browser.get('https://www.baidu.com')  

#打印网页标题
print(browser.title)
#输出内容:百度一下,你就知道

二、获取页面URL

#获取当前页面的URL
current_url
from selenium import webdriver
import time  

browser = webdriver.Chrome()
browser.get('https://www.baidu.com')  

#打印网页标题
print(browser.current_url)
#输出内容:https://www.baidu.com/

三、获取浏览器版本号

#打印浏览器version的值
capabilities[‘version’])
from selenium import webdriver
import time

browser = webdriver.Chrome()
browser.get(‘https://www.baidu.com’)

#打印网页标题
print(browser.capabilities[‘version’])
#输出内容:67.0.3396.87

四、获取元素尺寸

#返回元素的尺寸
size
from selenium import webdriver
import time  

browser = webdriver.Chrome()
browser.get('https://www.baidu.com')  

#定位输入框
input_box = browser.find_element_by_id('kw')
#打印输入框尺寸
print(input_box.size)
#输出内容:{'height': 22, 'width': 500}

五、获取元素的文本

返回元素的文本信息
text
from selenium import webdriver
import time  

browser = webdriver.Chrome()
browser.get('https://www.baidu.com') 



#定位备案元素
recordcode = browser.find_element_by_id('jgwab')
#打印备案元素信息
print(recordcode.text)
#输出内容:京公网安备11000002000001号

六、获取元素属性值

get_attribute('')方法
get_attribute('href'):获取href属性值
get_attribute('id'):获取id属性值

实例

# coding=utf-8
import time
from selenium import webdriver


driver = webdriver.Chrome()
driver.maximize_window()
driver.implicitly_wait(6)
driver.get("https://www.baidu.com")
time.sleep(1)

for link in driver.find_elements_by_xpath("//*[@href]") 
    print (link.get_attribute('href'))
driver.quit()
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值