利用Selenium自动下载知网期刊文件
安装 Python 和Selenium 的过程就不讲了,下面直接上代码。目标是下载知网某个期刊某一期的全部文件(PDF格式)。这里以 《教育研究》这个期刊为例,下载其中2021年第5期的所有文献。
1 下载 Chrome 的 Webdriver
想要用 Selenium 操控浏览器,首先需要下载浏览器对应的WebDriver。Chrome 对应的 WebDriver 可以在
ChromeWebdriver下载地址
里面下载,注意浏览器的版本和 WebDriver 的版本必须匹配,不然可能会报错。谷歌浏览器的版本在 设置 → \rightarrow → 关于Chrome 里面查看。
2 代码
2.1 导入相关的包
from selenium import webdriver
from selenium.webdriver.common.by import By
import time
如果用的 Selenium 的版本是 Selenium4,那么第 2 行代码是需要