利用 Python 和 Selenium 自动下载知网期刊文件


安装 Python 和Selenium 的过程就不讲了,下面直接上代码。目标是下载知网某个期刊某一期的全部文件(PDF格式)。这里以 《教育研究》这个期刊为例,下载其中2021年第5期的所有文献。

1 下载 Chrome 的 Webdriver

想要用 Selenium 操控浏览器,首先需要下载浏览器对应的WebDriver。Chrome 对应的 WebDriver 可以在
ChromeWebdriver下载地址
里面下载,注意浏览器的版本和 WebDriver 的版本必须匹配,不然可能会报错。谷歌浏览器的版本在 设置 → \rightarrow 关于Chrome 里面查看。

查看浏览器版本

查看浏览器版本

2 代码

2.1 导入相关的包

from selenium import webdriver
from selenium.webdriver.common.by import By
import time

如果用的 Selenium 的版本是 Selenium4,那么第 2 行代码是需要

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值