有时需要对列表进行翻页操作,Selenium同样提供了相应API。
分页处理逻辑大致可分为以下三个步骤:
(1)获取总页数。
(2)获取所有分页并循环翻页。
(3)针对每一次分页进行后续逻辑处理。
以百度贴吧Python为例:
1.先定位到分页div
2.定位到尾页按钮
# -*- coding: utf-8 -*-
from selenium import webdriver
import time
from selenium.webdriver.common.by import By
driver = webdriver.Edge()
data = {
'index_url':'http://tieba.baidu.com/f?ie=utf-8&kw=python',
'pagination_id':'frs_list_pager',
'':''
}
# 访问Python吧首页
# frs_list_pager
driver.get(data['index_url'])
# 定位等到分页div
pagination_div = driver.find_element(by=By.ID,value
Selenium实现网页分页处理技巧

本文介绍了如何使用Selenium进行分页处理,以百度贴吧Python为例,详细讲解了获取总页数、遍历分页及处理每一页的步骤。在实践中遇到的问题是,由于总页数变量为字符串导致循环次数受限,通过转换类型解决了这一问题。
最低0.47元/天 解锁文章
488

被折叠的 条评论
为什么被折叠?



