需要安装的Python库包括:
pip install selenium
pip install openpyxl
Selenium需要安装Chrome Webdriver可以从网络下载拷贝到Chrome路径。
引用库
#import selenium libraries
from selenium importwebdriverfrom selenium.webdriver.common.by importByfrom selenium.webdriver.support.ui importWebDriverWaitfrom selenium.webdriver.support importexpected_conditions as EC#import excel library
from openpyxl importload_workbook#import time library
import time
等待页面加载完(指定内容元素出现)
#wait for report inital loading
defwaitLoad(driver):
element= WebDriverWait(driver, 200).until(
EC.presence_of_element_located((By.XPATH,".//*[text() = 'Past Due']"))
)
选择下拉菜单项目并点击按钮
#check/select application in application filter
defpickApp(driver,app):try:
elements= driver.find_elements(By.XPATH, ".//input[@value='"+app+"']")
driver.execute_script("arguments[0].click();", elemen

本文介绍了如何利用Python的selenium库和openpyxl库抓取网页数据,并将数据存储到Excel文件中。首先,安装selenium和openpyxl库,然后设置WebDriver等待页面加载完成,接着选择并点击网页上的下拉菜单项。通过初始化WebDriver,导航到目标网页,读取Excel文件获取应用列表,遍历每一项应用,查找并处理网页上的特定元素,如指标名称、总数、行动要求等。最后,关闭WebDriver并保存更新后的Excel工作簿。
最低0.47元/天 解锁文章
1215

被折叠的 条评论
为什么被折叠?



