上篇文章学习了Crawlab运行scrapy爬虫和单文件爬虫,这次学习Crawlab运行selenium爬虫,我的例子是单文件的。
环境准备
Crawlab虽然自带了一些爬虫用的第三方库,但是不全,总有一些库是你的代码需要但它没自带的,如selenium就没自带。
查看已安装的库
有两种方法可以看你的Crawlab是否安装了selenium(截图时我已安装),如果你没装,则下面的图中你看不到selenium。
方法一
方法二
安装需要的库
文档中有两处提到安装依赖,
本文介绍了如何在Crawlab中运行Selenium爬虫,包括检查和安装缺失的库,如selenium,以及通过requirements.txt自动化安装依赖。Crawlab在Docker环境下会自动准备Chrome和驱动。文章还展示了运行Selenium爬虫的代码示例,用于打开B站并保存登录二维码。
上篇文章学习了Crawlab运行scrapy爬虫和单文件爬虫,这次学习Crawlab运行selenium爬虫,我的例子是单文件的。
Crawlab虽然自带了一些爬虫用的第三方库,但是不全,总有一些库是你的代码需要但它没自带的,如selenium就没自带。
有两种方法可以看你的Crawlab是否安装了selenium(截图时我已安装),如果你没装,则下面的图中你看不到selenium。
文档中有两处提到安装依赖,
2726
1万+
5738