# -*- coding: utf-8 -*-
import time
import re
import io
from selenium import webdriver
from selenium.webdriver.common.action_chains import ActionChains
import sys
reload(sys)
sys.setdefaultencoding("utf-8")
option = webdriver.ChromeOptions()
option.add_experimental_option("excludeSwitches", ['enable-automation'])
option.add_experimental_option('prefs', {
"download.default_directory": "D:\\edesk\\outtask\\AIopt\\AIOPTjiaofu\\lunwen",
"download.prompt_for_download": False,
"download.directory_upgrade": True,
"plugins.always_open_pdf_externally": True #这句配置很重要
}
)
driver = webdriver.Chrome(chrome_options=option)
wait = ui.WebDriverWait(driver,20)
driver.get("https://xxxxx1-s2.0-S2095495621000383-main.pdf")
time.sleep(10)
driver.set_window_size(width=1000, height=800, windowHandle="current")
flag = False
if not flag:
#可以手动输入一次密码,后面访问均有cookie
raw_input('login:')
print "login!!!"
time.sleep(10)
driver.get("https://xxxxx1-s2.0-S2095495621000383-main.pdf")
time.sleep(20)
print "download!!!"
driver.quit()
【Python爬虫】:selenium下载pdf
最新推荐文章于 2024-04-17 19:14:59 发布
本文介绍了使用Python和Selenium实现网页自动化登录和PDF文件下载的过程,重点展示了如何配置Chrome选项以避免自动化检测。通过实际操作演示了如何处理密码验证并设置下载路径,适用于IT人员进行技术文档管理与自动化任务处理。
1168

被折叠的 条评论
为什么被折叠?



