python之selenium入门(二)

本文是Python Selenium入门的第二部分,主要内容包括如何使用Selenium进行网站登录操作,以及解决网页加载延迟的问题,如time.sleep()和WebDriverWait的使用与区别。通过这些知识,可以更好地进行Selenium的数据抓取。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

上一篇文章中介绍了如何使用网页驱动来运行浏览器以及如何找元素(以Firefox和百度首页为例),这篇文章将会介绍如何登陆以及其他的一些操作。

(一)、selenium登陆(以Firefox为例)

from selenium import webdriver

#使用网页驱动来运行火狐浏览器
driver = webdriver.Firefox()
#XXXXX部分为登陆界面的网址链接
driver.get('XXXXX')
#找到账号输入框,把账号输入进去
driver.find_element_by_name('username').send_keys('username')
#找到密码输入框,把密码输入进去
driver.find_element_by_class_name('password').send_keys('password')
#找到登陆按钮,使用点击事件
driver.find_element_by_link_text('登陆').click()

(二)、时间等待

selenium  由网页驱动驱使浏览器进行操作,速度慢是一大特点,经常会出现代码执行完了,但是网页内容还没有加载完毕,里面的标签还没有显示出来,如果这时候操作里面的标签就会爆出异常 NoSuchElementExpection
            解决办法:时间休眠

1、time.sleep()

from selenium.webdriver.support.ui import WebDriverWait
from selenium import webdriver
import time

driver = webdriver.Firefox()
driver.get('http://www.baidu.com')
button = driver.find_element_by_id('su')
#程序休眠10秒钟之后继续执行
time.sleep(10)
button.click()

2、WebDriverWait

from selenium.webdriver.support.ui import WebDriverWait
from selenium import webdriver

driver = webdriver.Firefox()
driver.get('http://www.baidu.com')
button = driver.find_element_by_id('su')
#网页等待直到标签显示出来
is_visible = WebDriverWait(driver,10).until(lambda driver:button.is_displayed())
print(is_visible)
button.click()

WebDriverWait和time.sleep()的相同点和不同点:

1、都是让程序等待执行的时间

2、time的时间是固定的,时间长短不会随着标签的加载速度而改变 # WebDriverWait时间是不固定的,等待多少时间要看                  标签的加载时间和指定的固定时间

3、如果在指定的时间内,标签仍然没有加载出来,那么time和WebDriverWait都会爆出异常

知道了这些基础知识,就可以使用selenium爬取数据了

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值